DE602004005234T2

DE602004005234T2 - System und verfahren zur signalverarbeitung

Info

Publication number: DE602004005234T2
Application number: DE602004005234T
Authority: DE
Inventors: Bruno K. Tourwe
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2003-07-07
Filing date: 2004-07-05
Publication date: 2007-11-08
Anticipated expiration: 2024-07-06
Also published as: EP1680781A1; ES2281816T3; WO2005004114A1; RU2347282C2; RU2006122948A; DE602004005234D1; EP1680781B1; ATE356405T1; US20070136050A1

Description

Die vorliegende Erfindung bezieht sich auf den Bereich der Tonwiedergabe und insbesondere auf den Bereich der digitalen Audiosignalverarbeitung.
Die vorliegende Erfindung bezieht sich auf ein Tonwiedergabesystem mit einem digitalen Audiosignaleingang, einem digitalen Audiosignalprozessor und einem digitalen Audiosignalausgang.
Die vorliegende Erfindung bezieht sich auch auf einen Audiosignalprozessor zum Verarbeiten eines eintreffenden Audiosignal zu einem Audioausgangssignal. Insbesondere bezieht sich die vorliegende Erfindung auf eine digitale Signalprozessorschaltung (DSP) oder ein derartiges Programm.
Die vorliegende Erfindung bezieht sich ebenfalls auf ein Verfahren zum verarbeiten eines digitalen Audiosignals.
Ein Tonwiedergabesystem, wie beispielsweise ein Lautsprechertelefonsystem, umfasst einen Ausgangswandler, oft als Lautsprecher bezeichnet, und einen Eingang für ein Audiosignal. Der Lautsprecher erzeugt Schalldruckwellen in Reaktion auf das Eingangsaudiosignal, das für eine gewünschte Schalldruckwelle repräsentativ ist.
Die Verständlichkeit des Schalls, wie dieser von dem Hörer erfahren wird, ist sehr wichtig, insbesondere in einer störungsbehafteten Umgebung. Die einfachste Art und Weise, die Verständlichkeit zu steigern ist, den mittleren Schalldruckpegel SPL ("Sound Pressure Level") zu steigern, d.h. die Lautstärke zu erhöhen. Aber ein einfaches Hochdrehen der Lautstärke führt nicht immer zu einem besser verständlichen Schall. Auch ein zu hoher Ausgangswert kann zu einer Überlastung eines Lautsprechers führen, was zu einer weiteren Verringerung der Verständlichkeit führt.
Es wurden bereits eine Anzahl Versuche angestellt, die Verständlichkeit von Schall zu verbessern.
Die US Patentanmeldung US 2002/001503 schlägt beispielsweise vor, die Verständlichkeit durch individuelle Einengung der Verstärkungsfaktoren für verschiedene Frequenzbänder zu steigern.
Die bestehenden Systeme und Verfahren sind aber entweder sehr kompliziert, indem sie komplizierte Berechnungen und dadurch eine komplizierte Schaltungsan ordnung (Hardware) erfordern, oder in dem Fall, dass ein Programm (Software) verwendet wird, ein komplexes Programm erfordern oder nur einen geringen Vorteil bieten.
Trotz der oben genannten Referenzen gibt es ein Bedürfnis in dem betreffenden Bereich nach verbesserten Systemen und Verfahren, die eine verbesserte Verständlichkeit schaffen.
Es ist nun u. a. eine Aufgabe der vorliegenden Erfindung, ein Tonwiedergabesystem und ein Verfahren mit einer besseren Verständlichkeit zu schaffen.
Dazu weist das Tonwiedergabesystem nach der vorliegenden Erfindung das Kennzeichen auf, dass das System einen digitalen Signalprozessor aufweist, wobei der digitale Signalprozessor ein Hochpassfilter (HP) mit einer Durchlassfrequenz zwischen einer ersten und einer zweiten Frequenz aufweist, vorzugsweise zwischen 300 Hz und 2 kHz, einen Kompressionsverstärker (22) zur Kompression und Verstärkung eines Signals, wobei wenigstens die Verstärkung nach der HP-Filterung durchgeführt wird, und einen Amplitudenbegrenzer zum Begrenzen des HP-gefilterten, komprimierten und verstärkten Signals über einem Begrenzungspegel.
Dem System nach der vorliegenden Erfindung liegen die nachfolgenden Erkenntnisse zugrunde:

1. Das eintreffende Signal wird verstärkt um die Loudness zu steigern, aber
2. das Steigern des eintreffenden Signals könnte zu einem Signal höher als das maximale digitale Signal führen, unter solchen Umständen würde das Signal oft digital begrenzt werden, was zu einer Verzerrung des Signals führt.
3. Niedrige Frequenzen werden aus dem Signal entfernt, dies ermöglicht es, dass der restliche Teil des Signals mit im Schnitt einem höheren Verstärkungsfaktor verstärkt werden muss. Dies geschieht durch das Hochpassfilter HP, das sich vor der Verstärkung befindet. Die niedrigeren Frequenzen sind, insofern es sich um die Verständlichkeit handelt, von geringerer Bedeutung. Die niedrigeren Frequenzen umfassen einen großen teil der Amplitude des Signals, so dass Entfernung der niedrigeren Frequenzen die Amplitude des Signals stark beeinträchtigt, wodurch Raum für Verstärkung geschaffen wird, d.h. eine höhere Verstärkung für den restlichen Teil des Signals. Ein großer Teil der Amplitude insbesondere von Sprache befindet sich in den niedrigeren Frequenzen, so dass Dämpfung der niedrigeren Frequenzen eine wesentliche Steigerung an Kopfraum bietet (d.h. Verstärkung ohne dass dadurch ein Begrenzungspegel getroffen wird).
4. Ein einfaches Beschneiden der niedrigeren Frequenzen und eine Steigerung des Ausgangs würde laute Töne ebensoviel steigern wie die gedämpfte Töne. Obschon dies zu einer Verbesserung der Verständlichkeit führt, führt dies nicht immer zu einer einfach wahrnehmbaren Steigerung der Verständlichkeit, insbesondere nicht, wenn der Loudnessbereich, d.h. der komprimierte Amplitudenbereich groß ist. Zur weiteren Steigerung der Verständlichkeit umfasst die Anordnung einen Kompressionsverstärker zur Verstärkung und Kompression eines Signals. Der Amplitudenbereich wird dann komprimiert (sowie verstärkt). Der Clipper begrenzt das Signal über einem Begrenzungspegel, der Begrenzungspegel befindet sich innerhalb des komprimierten Amplitudenbereichs, wobei die mittlere Loudnessdifferenz reduziert wird. Die mehr gedämpfte Töne erfahren eine größere Verstärkung als die lautere Töne (was zu einer Kompression des Signals bis in den komprimierten Amplitudenbereich führt), was die Verständlichkeit steigert, weil die mehr gedämpfte Töne besser unterschieden werden können. Dies geschieht durch den Kompressionsverstärker. Jede beliebige gewünschte funktionelle Form in Bezug auf die Signalamplitude EIN zu Signalamplitude AUS kann als Kompressionsverhältnis implementiert werden, beispielsweise mit einer Nachschlagtabelle. Die lautesten Töne werden dadurch begrenzt, dass der Begrunzungspegel innerhalb des komprimierten Amplitudenbereichs gelegt wird, was die Verständlichkeit weiter steigert. Dies geschieht durch den Clipper. Das Signal wird bei einer bestimmten Amplitude (Begrenzungspegel) innerhalb des komprimierten Amplitudenbereichs begrenzt, wobei die Grenzen, insbesondere die obere Grenze, auf die Initialisierungszeit gesetzt wird. Die Kompressionsaktion kann wenigstens teilweise vor oder nach der HP-Filterung erfolgen, die Verstärkung an sich (d.h. der Hauptteil der Verstärkung) erfolgt nach der HP-Filterung, da dies die Entfernung der niedrigeren Frequenzanteile durch die HP Filterung ist, was die im Schnitt höhere Verstärkung des restlichen Teils (d.h. Steigerung des (Kopfraums) ermöglicht.

Das Konzept des Begrenzers soll nicht als auf eine harte Begrenzung beschränkt verstanden werden (d.h. alle Werte über einem vorbestimmten Wert C werden gleich C gesetzt), sondern soll auch weiche Begrenzungen aufweisen, die in einem Subbereich bis zu der hohen Grenze des komprimierten Amplitudenbereichs ein anderes vorbestimmtes Signalamplitude-EIN/Signalamplitude-AUS Verhältnis anwendet.
Vorzugsweise wird der Kompressionsverstärker vorgesehen nicht zum Verstärkern eines Signals mit einer Signalstärke unterhalb eines Schwellenwertes.
Unterhalb eines Schwellenwertes (einer bestimmten minimalen Amplitude) ergibt sich das Signal wahrscheinlich aus Rauschanteilen. Das nicht Verstärkern derartiger Signal verbessert die Verständlichkeit, da die Störung reduziert wird. Weiterhin lässt sich die Differenz zwischen Stille und Sprache besser unterscheiden, was die Verständlichkeit auch steigert. Die Schwelle kann bei der Auslösungszeit eingestellt werden.
Vorzugsweise umfasst der digitale Schallprozessor ein Tiefpassfilter zur Filterung des von dem komprimierenden Verstärker gelieferten Signals und zum Schaffen eines Ausgangssignals, wobei die Durchlassfrequenz des Tiefpassfilters in dem Bereich 2 kHz-Fs/2 liegt, wobei Fs die Abtastfrequenz ist.
Der Kompressionsvorgang, aber insbesondere der Begrenzungsvorgang kann störende Übertöne einführen, welche die Natürlichkeit und die Verständlichkeit des emittierten Tons reduzieren. Weiterhin umfasst durch die Verwendung des Hochpassfilters das Signal bereits einen relativ hohen Anteil an HF-Tönen. Das Tiefpassfilter schneidet die von dem komprimierenden Verstärker erzeugten Übertöne aus oder reduziert sie, was zu einem mehr natürlichen Schall führt und die Verständlichkeit steigert.
Das Hochpassfilter ist vorzugsweise ein Filter erster Ordnung oder zweiter Ordnung, d.h. ein Filter mit einer relativ allmählichen Neigung. Es ist vorteilhaft, viel Energie der NF-Anteile des eintreffenden Signals zu entfernen um Raum für die Verstärkung zu schaffen. Ein Filter aber mit einer Neigung, die relativ steil ist (wobei ein Stufenfilter das meist extreme Beispiel einer derartigen Filters ist), entfernt soviel der NF-Anteile, dass dies zu einer unnatürlichen Stimme führt. Vorzugsweise umfasst die Anordnung ein Mittel, durch das der Benutzer die Möglichkeit hat, die Ordnung und/oder die Grenzfrequenz zu ändern Die Verwendung eines Hochpassfilters zweiter Ordnung führt zu einer guten Sprachverständlichkeit und/oder einer guten gehörrichtigen Lautstärke des Signals, während die Verwendung eines Hochpassfilters erster Ordnung den mehr natürlichen Ton des ursprünglichen Signals beibehält.
Vorzugsweise umfasst das System und/oder das Programm ein Mittel zur Aktivierung und/oder Einstellung der Frequenzabhängigkeit des Tiefpassfilters und/oder des Hochpassfilters zu einer Abhängigkeit von der mittleren Verstärkung in der einpegelnden Verstärkungsstufe. Die mittlere Verstärkung ist ein Maß für die mittlere Verstärkung des Signals und dadurch des Loudnesspegels des emittierten Schallsignals. Es ist vorteilhaft, wenn die Grenzfrequenz des Hochpassfilters bei steigendem mittleren Loudnesspegel des emittierten Signals zunimmt und die Grenzfrequenz des Tiefpassfilters mit steigendem Loudnesspegel abnimmt.
Bei sehr hohen Verstärkungspegeln (wie dies passieren könnte, wenn die Anordnung in einer lauten störungsbehafteten Umgebung verwendet wird) ist der Einpegelungsvorgang relativ umfangreich, dieser relativ umfangreiche Einpegelungsvorgang führt eine relativ große Störung des Signals ein, d.h. die unerwünschten, unnatürlichen Obertöne des Signals enthalten viel Energie. Dies führt zu einem rauen Ton. Die Rauheit des Tones, wie dies von dem Hörer erfahren wies, führt manchmal und sogar oft dazu, dass der Hörer den Lautsprecher, insbesondere bei Mobiltelefonen, in gewissem Abstand vom Ohr hält. Abgesehen von der Tatsache, dass der Lautsprecher in gewissem Abstand vom Ohr gehalten wird, wird an sich zu einer wesentlichen Verringerung des Störabstandes führen, da das Signal reduziert wird und die Störung zunimmt bedeutet die Tatsache, dass der Schall an sich als rau erfahren wird, im Wesentlichen eine Reduktion der Verständlichkeit der gegebenen Nachricht. Für stimmliche Nachrichten ist die Härte der Stimme oft ein integraler Teil der Nachricht, welche die sprechende Person an den Hörer richten möchte, manchmal noch wichtiger als die wirklichen Wörter der Nachricht. Deswegen ist es für die Verständlichkeit wichtig, gesehen im Konzept breites als nur ob Wörter verstanden werden, dass eine klare "natürliche" Übertragung der Stimme erreicht wird. Bei niedrigeren Verstärkungspegeln ist der "raue Ton" viel weniger hörbar. Selektive Aktivierung oder Einstellung der Grenzfrequenz auf einer relativ niedrige Frequenz des Tiefpassfilters auf hohen Verstärkungspegeln reduziert den "rauen Schalleffekt", während auf niedrigen Verstärkungspegeln die Notwendigkeit einer Verwendung des Hochpassfilters geringer ist, und nicht Aktivierung des Hochpassfilters in Wirklichkeit zu einem mehr natürlichen Ton führt. Kurz gesagt bei hohen Verstärkungspegeln und bei einer starken Einpegelungsaktion ergib sich ein relativ großer Teil der Amplitude bei hohen Frequenzen aus künstlichen Artefakten wegen der Einpegelungsaktion und Entfernung (völlig oder teilweise) der höheren Frequenzen entfernt die Artefakte, was folglich zu einem mehr natürlichen Ton führt, bei relativ niedrigen Verstärkungspegeln und einer relativ gemäßigten Einpegelungsaktion, ist wesentlich mehr der Signalamplitude bei hohen Frequenzen von natürlichem Ursprung und viel weniger wegen künstlicher Artefakte, so dass die nicht Verwendung des Tiefpassfilters (oder Einstellung der Grenzfrequenz auf eine relativ hohe Frequenz dann bevorzugt wird. Durch selektive Aktivierung des Hochpassfilters abhängig von der Verstärkung ist eine bessere Tonwiedergabe möglich. Statt einer Aktivierung/Deaktivierung des Tiefpassfilters (d.h. eine EIN/AUS-Wahl) kann die Filtercharakteristik des Tiefpassfilters von der Verstärkung abhängig gemacht werden, beispielsweise mit einer Filtergrenzfrequenz von 2 kHz für eine hohe Verstärkung (lautstarke Umgebungsstörung) und Fs/2, oder 4 kHz, für eine niedrige Verstärkung oder ohne Umgebungsstörung, oder mit anderen Worten, wobei die Grenzfrequenz abnimmt, je nachdem der Loudnesspegel zunimmt.
Auf alternative Weise kann die Anordnung ein Mittel aufweisen zur handmäßigen Einstellung der Filterkennlinie des Tiefpassfilters, beispielsweise eine Knopf, der ers ermöglicht, dass der Benutzer die Filtergrenzfrequenz auf 2, 3 oder 4 kHz einstellt, und zwar abhängig von der Verständlichkeit oder dem Mangel an Verständlichkeit, oder je nach persönlichen Vorzügen. Ein ähnliches Argument gilt für das Hochpassfilter, bei niedrigen Verstärkungspegeln ist die Notwendigkeit der Verwendung eines Hochpassfilters geringer als bei hohen Verstärkungspegeln, so dass bei niedrigen Verstärkungspegeln das Hochpassfilter deaktiviert werden kann oder dass ein niedriger Grenzfrequenzpegel gegeben werden kann, während bei einem hohen Amplitudenpegel (hohe Loudness) das Hochpassfilter aktiviert werden kann oder die Grenzfrequenz kann auf eine relativ hohen Wert gesetzt werden, oder mit anderen Worten, die Grenzfrequenz des Hochpassfilters nimmt zu, je nachdem der Loudnesspegel zunimmt.
In einer ersten Ausführungsform umfasst das System das Hochpassfilter mit einer nachfolgenden AVR mit einem nachfolgenden Begrenzer, vorzugsweise mit einem nachfolgenden Tiefpassfilter. Diese Ausführungsform wird bevorzugt, wenn unter Umständen, in denen die Loudness von höchster Bedeutung ist. Ein Begrenzer sucht nach Spitzen in dem Audiosignal und dämpft den Audioteil um die Spitze herum, wenn die Dämpfung notwendig ist, um den Begrenzungsbetrag zu begrenzen, während dennoch für sehr laute Signale Begrenzung gestattet wird.
In einer zweiten Ausführungsform umfasst das System einen automatischen Lautstärkenausgleicher, dem das Hochpassfilter vorhergeht, oder vorzugsweise folgt, wobei ein ausgeglichenes Signal geschaffen wird, mit einem nachfolgenden Verstärker und Begrenzer, dem vorzugsweise ein Tiefpassfilter folgt. Diese Ausführungsform wird bevorzugt, wenn geringer rechnerischer Aufwand bevorzugt wird.
Eine (harte) Begrenzung ist ein einfacher Vorgang, bei dem alle Signale über einer Schwellensignalstärke auf die genannte bestimmte Schwellensignalstärke redu ziert wird, d.h. es wird eine maximale Signalstärke eingestellt. Der Vorteil einer derartigen Ausführungsform ist, dass eine einfache Anordnung verwendet wird, der Nachteil ist, dass das Signal stärker gestört wird, da alle Einzelheiten in dem Signal über dem Schwellensignal verloren gehen.
In bevorzugten Ausführungsformen umfasst die Anordnung eine Messanordnung, wie ein Mikrophon, zum Messen der Hintergrundstörpegel. Die Anordnung umfasst einen Adapter zum Anpassen eines oder mehrerer Parameter in Abhängigkeit von dem gemessenen Hintergrundstörpegel. Der artige Parameter sind beispielsweise die Grenzfrequenz und die Ordnung des Hochpassfilters, die Grenzfrequenz und die Ordnung des Tiefpassfilters, die Verstärkung, der Begrenzungspegel.
Vorzugsweise ist für einen oder mehrere Parameter die Abhängigkeit von dem gemessenen Störpegel nicht linear.
Innerhalb des Konzepts der vorliegenden Erfindung sollen "Begrenzer", "Kompressor", "Verstärker", "Filter", "Wandler", "Vergleichsanordnung" usw. im breiten Sinne verstanden werden und beispielsweise jedes Stück Hardware umfassen (wie einen Begrenzer, einen Kompressor, einen Verstärker, usw.), jede Schaltungsanordnung oder Hilfsschaltungsanordnung, entworfen zum Durchführen einer Begrenzungs-, einer Kompressions-, einer Verstärkungsfunktion usw., wie beschrieben, sowie jedes Stück Software (Computerprogramm oder Hilfsprogramm oder einen Satz von Computerprogrammen oder Programmcode(s)), entworfen oder programmiert zum Durchführen eines Begrenzungs-, Kompressions-, Filtervorgangs nach der vorliegenden Erfindung, sowie jede beliebige Kombination von Stücken Hardware und Software, die als solche wirksam sind, allein oder in Kombination mit einander, ohne dass sie auf die nachstehend gegebenen Ausführungsbeispiele begrenzt sind. Ein einziges Programm kann verschiedene Funktionen kombinieren.
Die vorliegende Erfindung ist auch in jedem beliebigen Computerprogramm mit Programmcodemitteln zum Durchführen eines Verfahrens nach der vorliegenden Erfindung verkörpert, wenn das genannte Programm in einem Computer läuft, sowie in jedem beliebigen Computerprogrammprodukt, das Programmcodemittel aufweist, die auf einem vom Computer auslesbaren Medium gespeichert sind zum Durchführen eines Verfahrens nach der vorliegenden Erfindung, wenn das genannte Programm in einem Computer läuft, sowie jedes beliebige Programmprodukt mit Programmcodemitteln zur Verwendung in einem Telefonsystem nach der vorliegenden Erfindung, zum Durchführen der für die Erfindung spezifischen Aktion.
Ausführungsbeispiele der vorliegenden Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben. Es zeigen:
1 eine schematische Darstellung eines Systems mit einem Lautsprecher und einem DSP,
2 eine schematische Darstellung eines DSPs nach der vorliegenden Erfindung,
3 zwei Beispiele von Hochpassfiltern, die nach der vorliegenden Erfindung verwendet werden können,
4 die Wellenform eines typischen Sprachsignals,
5 eine Darstellung der Wellenform, nachdem diese durch das Hochpassfilter gefiltert worden ist,
6 das Spektrum der Wellenform nach den 4 und 5,
7 eine Art von Ausführungsformen nach der vorliegenden Erfindung,
8 das funktionelle Blockschaltbild eines Beispiels einer AVR, wie in 7 schematisch dargestellt,
9 eine andere Art von Ausführungsform,
10 ein detailliertes Beispiel eines AVL-Elementes, wie in 9 schematisch angegeben,
11 das AVL-Verhalten des AVL-Elementes nach 10,
12 ein Beispiel eines funktionellen Kompressionsverhältnisses,
13 eine bevorzugte Ausführungsform, wobei Parameter in Abhängigkeit von einem gemessenen Rauschpegel angepasst sind,
14 eine Abhängigkeit erster, zweiter und dritter Ordnung eines Parameters P von dem Rauschpegel S.
Die vorliegende Erfindung wird nun nachstehend anhand der beiliegenden Zeichnung näher beschrieben, wobei bevorzugte Ausführungsformen der vorliegenden Erfindung dargestellt sind. Diese Erfindung kann aber in vielen verschiedenen Formen verkörpert werden und soll nicht als auf die hier beschriebene Ausführungsform beschränkt betrachtet werden; stattdessen werden diese Ausführungsformen derart vorgesehen, dass diese Beschreibung sorgfältig und komplett ist, und wird dem Fachmann den Rahmen der vorliegenden Erfindung völlig übertragen. Gleiche Bezugszeichen bezeichnen entsprechende Elemente.
1 zeigt schematisch ein Tonwiedergabesystem. Ein derartiges System kann beispielsweise ein zellulares Freisprechfunktelefon mit Lautsprecher zur Verwendung in einem Kraftwagen. Wenn als Freisprechzellulartelefon implementiert werden von einem Fernende, d.h. von einer Partei auf Abstand, empfangene Sprachsignale von einer (nicht dargestellten) zellularen Basisstation übertragen, von dem Transceiver des (nicht dargestellten) zellularen Telefon empfangen und dem Eingang 1 für ein eintreffendes Fernsignal als Eingangswellenform W zugeführt. In diesem Beispiel wird vorausgesetzt, dass die Übertragung hin und zurück zwischen dem System, in diesem Beispiel einem Telefonsystem, und dem fernen Ende in digitaler Form stattfindet. Wenn die ursprünglichen Signale in analoger Form sind, umfasst das System einen Analog-Digital-Wandler um ein digitales Fernsignal zu schaffen, das dann dem Eingang 1 zugeführt wird.
Wie in 1 dargestellt, wird die Wellenform in einem digitalen Format dem Eingang 1 eines DSPs 2 zugeführt oder wird damit verbunden, der mit einem digitalen Ausgang 3 verbunden ist oder der diesen Ausgang enthält. Der digitale Signalausgang wird mit Hilfe eines Digital-Analog-Wandlers 4 einem analogen Format zugeführt und wird in dieses Format umgewandelt und durch den Verstärker 5 zur Verwendung durch einen Lautsprecher 6 verstärkt. Eine Schalldruckwelle W1, die für die Sprache der Fernpartei repräsentativ ist, wird durch den Lautsprecher 5 emittiert. Auf entsprechende Weise hört das Funktelefon Schallwellenformen, die für die Sprache der Fernpartei repräsentativ sind.
Der Hörer aber hört nicht nur den von dem Lautsprecher erzeugten Schall, sondern auch andere Geräusche, die machen können, dass der von dem Lautsprecher erzeugte Schall schwer verständlich ist, d.h. eine niedrige Verständlichkeit hat.
Hochschrauben der Lautstärke scheint eine erste und auf der Hand liegende Möglichkeit zu sein, um die Verständlichkeit zu steigern. Aber der maximale Ausgangspegel des Lautsprechers ist oft begrenzt und ein einfaches Hochschrauben der Lautstärke führt zu mehr Störung, und nicht notwendigerweise zu einer besseren Verständlichkeit des Signals.
Zur Verbesserung der Verständlichkeit werden in der Anordnung und in dem Verfahren nach der vorliegenden Erfindung eine Anzahl zusammenarbeitender Maßnahmen getroffen.
2 zeigt sehr schematisch einen DSP (digitalen Schallprozessor) zur Verwendung in einer Anordnung nach der vorliegenden Erfindung. Der DSP umfasst ein Hochpassfilter 21 mit einer Grenzfrequenz zwischen 300 Hz und 2 kHz, vorzugsweise zwischen 500 und 1500 Hz, aber noch lieber zwischen 800 und 1200 Hz. Das Hochpassfilter entfernt oder reduziert Frequenzanteile unterhalb der Grenzfrequenz f.
Der Hauptteil der Energie des Signals ist dadurch entfernt. Dies ermöglicht es, dass das restliche Signal viel mehr verstärkt wird (bevor es in die Probleme Gerät in Bezug auf eine digitale Begrenzung, d.h. ein Wert höher als der maximale Wert). Die Verstärkung erfolgt durch den komprimierenden Verstärker. Innerhalb des Konzeptes der vorliegenden Erfindung ist ein komprimierender Verstärker ein Verstärker, der das Signal verstärkt, aber aus den mittleren Schallpegel einpegelt, d.h. Töne mit einer geringen Amplitude werden mehr verstärkt als Töne mit einem hohen Schallpegel, wodurch auf diese Weise der Signalamplitudenbereich reduziert wird. Dies kann verschiedenartig erfolgen, beispielsweise mit Hilfe einer Begrenzungsanordnung, eines Kompressors oder eines AVLs (automatischen Spannungsreglers) mit einem nachfolgenden Verstärker und Begrenzer. Es können eine Anzahl verschiedener Techniken angewandt werden, einschließlich der Verwendung von Nachschlagtabellen zum Durchführen der Verstärkung und Kompression. Der Amplitudenbereich, insbesondere die obere Grenze des Bereichs, kann vom Hersteller eingestellt oder durch den Benutzer beeinflusst werden, beispielsweise mit Hilfe des Loudnessreglers (eines Knopfes, mit dem der Benutzer die Loudness einstellen kann). Nachstehend folgen mehrere Beispiele. Im Vergleich zu einer unkomplizierten linearen Verstärkung des Signals (d.h. für alle Schallpegel einen gleichen Verstärkungsfaktor) führt die komprimierte Verstärkung zu einer besseren Verständlichkeit des Schalls. Die Wörter sind leichter voneinander zu unterscheiden und folglich wird die Verständlichkeit des Schalls verbessert. Es kann aber auch zu einer Verzerrung des Schalls führen, da die nicht lineare Verstärkung des Schalls Übertöne einführte (hohe Frequenzanteile mit der doppelten, dreifachen usw. ursprünglichen Frequenz), was zu einer gesteigerten Rauheit des Schalls führt. Dies wird von dem Hörer als unangenehm erfahren und im Wesentlichen reduziert dies in wesentlichen Maße die Verständlichkeit in breitem Sinne der gesprochenen Nachricht, da die Rauheit der gesprochenen Wörter oft ein wesentlicher Aspekt der vokalen Nachricht bildet. Dieser Effekt ist sogar ohne Begrenzung vorhanden, das Begrenzen an sich führt auch Obertöne ein. Verständlichkeit in breiterem Sinne bezieht sich nicht nur auf die Wörter an sich, sonder auch auf die Nachricht, die der Sprecher zu dem Hörer übertragen möchte. Die Rauheit des Schalls, insbesondere bei einer höheren mittleren Verstärkung macht jeden schallzornig, folglich eine starke Reduktion der Feinheit in Emotionen, die der Sprecher übertragen möchte. Die Applikation eines Tiefpassfilters, wie in der bevorzugten Ausführungsform der Anordnung, dargestellt in 2, nachdem der komprimierende Verstärker die erfahrene Härte der Stimme reduziert, wobei der ursprüngliche emotionelle Inhalt der gesprochenen Wörter wenigstens gewissermaßen wieder hergestellt wird, d.h. wodurch ein mehr natürlicher Schall gegeben wird. Es sei bemerkt, dass in den meisten westlichen Sprachen die Tonhöhe eines Wortes die emotionelle Auswirkung der Wörter beeinflusst, nicht aber die Bedeutung des Wortes an sich. Es gibt aber Sprachen, in denen die Tonhöhe des Wortes eine viel größere Rolle spielt, was zu einer völlig anderen Bedeutung für dasselbe Wort führt, und zwar abhängig von der Tonhöhe des Wortes. Wenn derartige Sprachen verwendet werden (was nicht ausgeschlossen werden kann), kann die Verwendung eines Tiefpassfilters noch günstiger werden. Die vorliegende Erfindung ist insbesondere günstig, wenn sie im Zusammenhang mit automatischen Spracherkennungssystemen oder in derartigen Systemen angewandt wird, insbesondere für Sprachen, in denen die Tonhöhe des gesprochenen Wortes die Bedeutung desselben beeinflusst. Was oben in Bezug auf gesprochene Wörter beschrieben worden ist, d.h. Stimme, gilt auch wenn das Tonwiedergabesystem zum Wiedergeben von Musik verwendet wird. Auch in der Musik ist die Art und Weise, wie Musik erfahren wird, selbstverständlich davon abhängig, ob die Töne hören kann, aber auch die Rauheit des Schalls ist sehr wichtig. Die vorliegende Erfindung ist folglich, obschon von großer Bedeutung für Systeme, bei denen mündliche Nachrichten übertragen werden, wie Telefonsystemen, nicht auf derartige Systeme beschränkt, Systeme zum Wiedergeben von Musik können auf gleiche Weise Vorteile aus der vorliegenden Erfindung ziehen.
Der Einpegelungs- oder Kompressionsvorgang kann vor der Hochpassfilterung des eintreffenden Signals oder nach derselben erfolgen. Die Verstärkung an sich erfolgt nach der Hochpassfilterung. Die Begrenzung erfolgt nach der Verstärkung oder im Zusammenhang damit. Wenn ein Tiefpassilter verwendet wird, befindet sich dies hinter dem Begrenzer.
3 zeigt zwei Beispiele von Hochpassfiltern, verwendbar in einem System nach der vorliegenden Erfindung.
Die linke Seite der Figur zeigt ein Filter erster Ordnung, die rechte Seite ein Filter zweiter Ordnung. Das dargestellte Hochpassfilter hat eine Grenzfrequenz f von etwa 1 kHz. Die Hochpassfilter erster und zweiter Ordnung (die eine relativ mäßige Steigung von 5-15 dB je Oktave haben werden bevorzugt. Wenn zu viel des NF-Anteils entfernt wird, führt dies zu einer sehr unnatürlich klingenden Stimme (oder unnatürlich komisch klingenden Musik). Deswegen wird die Ordnung des Hochpassfilters vorzugsweise auf 2 begrenzt. Auch dies reduziert den erforderlichen Rechenaufwand. Vorzugsweise kann der Benutzer das Hochpassfilter von der ersten in die zweite Ordnung und umgekehrt ändern, oder das System weist einen automatischen Umschaltmechanismus auf, der abhängig von dem eintreffenden Signal funktioniert. Die Verwendung eines Filters zweiter Ordnung führt zu einer hohen Sprachverständlichkeit (in begrenztem Sinne, d.h. nur die Wörter) und/oder einer Signallautheit, während das Hochpassfilter erster Ordnung den natürlichen Schall des ursprünglichen Signals besser beibehält.
Das Hochpassfilter kann beispielsweise aus einer Biquad bestehen, deren Frequenzgrößenreaktion in 3 dargestellt ist und deren Koeffizienten in der Tabelle 1 aufgelistet sind, und zwar entsprechend dem nachfolgenden Format
Tabelle 1 – Filterkoeffizienten der in Fig. 3 dargestellten Hochpassfilter.
Die Effekte der Applikation eines Hochpassfilters sind in den 4, 5 und 6 ersichtlich. 4 zeigt die Wellenform eines typischen Sprachsignals, 5 die Wellenform nachdem das Signal durch das Hochpassfilter gefiltert worden ist (verarbeitet durch ein Hochpassfilter erster Ordnung, Grenzfrequenz bei 1 kHz).
6 zeigt das Spektrum der in den 4 und 5 dargestellten Wellenform, wobei die Signalenergie der Wellenform aus 4 in der oberen Kurve dargestellt ist, die Signalenergie der Wellenform nach dem Hochpassfilter in der unteren Kurve dargestellt ist. Wie in 6 ersichtlich, ist die Signalenergie der Wellenform nach 4 vorwiegend in den niedrigeren Frequenzen (unterhalb 1 kHz) konzentriert.
Diese Frequenzen liefern einen Beitrag vorwiegend zu dem spezifischen Ton der Stimme, aber weniger zu der Verständlichkeit der Sprache. Diese Eigenschaft bildet einen Aspekt der vorliegenden Erfindung.
Durch Dämpfung der niedrigeren Frequenzen wird die Signalamplitude wesentliche abnehmen, wie in 6 ersichtlich, was Kopfraum zum verstärken des restlichen Signals bietet, das relativ mehr Frequenzen enthält, die einen Beitrag zu der Verständlichkeit der Sprache liefern, wie in 6 ersichtlich.
Wenn das Sprachsignal nachher komprimiert und verstärkt wird, sogar wenn es begrenzt wird, wird die Sprachverständlichkeit besser sein als ohne die Verwendung des Hochpassfilters, und zwar aus vorwiegend zwei Gründen:

– das Signal enthält relativ mehr Frequenzen, die einen Beitrag zu der Verständlichkeit der Sprache liefern,
– die niedrigen Frequenzen werden weniger hart begrenzt, was zu weniger Harmonischen führt (und zwar wegen der Begrenzung), welche die Verständlichkeit der Sprache stören.

Wenn aber zuviel niedrige Frequenzen entfernt werden wird dies zu einer sehr unnatürlich klingenden Stimme führen. Deswegen wird bevorzugt, dass das Hochpassfilter nur von der ersten Ordnung ist, beispielsweise ein Butterworth-Filter (IIR Filter erster Ordnung). Dies hatte den Vorteil eines geringen rechnerischen Stromverbrauchs.
7 zeigt eine Einzelheit in einem System nach einer Ausführungsform der vorliegenden Erfindung.
Der DSP umfasst ein Hochpassfilter (beispielsweise ein Filter, wie in 3 dargestellt, in diesem Beispiel beispielsweise ein Butterworth Filter erster oder zweiter Ordnung mit einem Grenzfrequenzwert von beispielsweise 1 kHz). Dem eine AVR folgt, hinter der ein Begrenzer vorgesehen ist und zum Schluss ein Tiefpassfilter (LP).
In diesem Beispiel können alle Audioströme mono sein. Die Abtastratenfrequenz kann beispielsweise eine der nachfolgenden Frequenzen sein: 8 kHz, 11,025 kHz, 16 kHz, 22,05 kHz, 32 kHz, 44,1 kHz oder 48 kHz.
In diesem Beispiel funktioniert die AVR auf Blockbasis, was bedeutet, dass der Verstärkungsfaktor nur blockartig sich ändert. Auf diese Weise wird die rechnerische Leistung auf ein Minimum begrenzt.
8 zeigt das funktionelle Blockschaltbild der AVR. Die Verstärkung wird derart berechnet, dass das RMS des AVR-Ausgangsblocks dem RMS des AVR-Eingangsblocks nahezu entspricht. Deswegen wird die Beziehung des Eingangs-RMS zu dem Ausgangs-RMS (d.h. dem Zielwert) mit der wirklichen Verstärkung verglichen und diese Verstärkung wird in Richtung des Zielwertes geregelt. Die Verstärkungsschwankungen müssen geglättet werden, um zuviel Signalverzerrung zu vermeiden, verursacht durch örtliche Wellenformunterbrechungen an den Blockrändern.
Der Begrenzer steigert den Loudnesspegel indem Signalverzerrung innerhalb Grenzen gehalten wird, vorzugsweise möglichst niedrig.
In diesem Beispiel ist der Begrenzer eine auf Abtastwerte basierte Verstärkung. In üblichen Kompressionstechniken ist die Verstärkung abhängig von dem verfügbaren Signalkopfraum.
Der Begrenzer kann einen sog. Gipfelfaktor verwenden um die erlaubte Verstärkung zu berechnen. Der Gipfelfaktor ist im Wesentlichen die Beziehung zwischen dem Spitzenwert und dem laufenden RMS-Wert der Signale. In dem Begrenzer werden Signale mit einem hohen Gipfelfaktor, beispielsweise Trommelschläge, ohne stark hörbare Verzerrung begrenzt. Wenn dies geschieht, kann die Verstärkung auf einem höheren Pegel bleiben, wobei der "Pumpeffekt" des üblichen Kompressors reduziert wird.
Die Verstärkung wird wie in dem Ausführungsbeispiel berechnet:
Allererst wird der laufende RMS-Wert des Eingangssignals berechnet. Dieser RMS-Wert ist ein geglätteter Mittelwert auf Basis einer jungen "Historie" der Signalwellenform. Danach wird der Spitzenwert berechnet, und zwar unter Verwendung einer Vorgriffszeit um auf kommenden Signalspitzen vorzugreifen.
Mit dem RMS- und dem Spitzenwert wird der Gipfelfaktor berechnet. Ein sog. "Entgipfelungs"-Faktor wird angewandt um zu spezifizieren, wie hart der Algorithmus spitze Signale begrenzt (hohe Werte werden mehr Begrenzung ergeben). Nachher wird die Verstärkung berechnet und mit der maximal erlaubten Verstärkung verglichen, die durch den Benutzer eingestellt werden kann, und der kleiner Wert der beiden wird gewählt. Obschon an dieser Stelle nicht dargestellt, kann die maximal erlaubte Verstärkungsregelung ein Eingang für das Hochpassfilter sein, wobei die Grenzfrequenz eine Funktion (oder im Allgemeinen eine oder mehrere Kennlinien des Filters, die abgesehen von dem Wert der Grenzfrequenz auch oder auf alternative Weise beispielsweise das Umschalten von einem Filter erster Ordnung zu einem Filter zweiter Ordnung) der maximal erlaubten Verstärkungsregelung ist.
Das Tiefpassfilter LP filtert die hohen Frequenzen mit der Folge eines mehr natürlichen Klangs. Obschon an dieser Stelle nicht dargestellt, kann die maximal erlaubte Verstärkungsregelung ein Eingang für das Hochpassfilter sein, wobei die Grenzfrequenz eine Funktion (oder im Allgemeinen eine oder mehrere Kennlinien des Filters, die nebst dem Wert der Grenzfrequenz auch oder auf alternative Weise beispielsweise das Umschalten von der ersten Ordnung in die zweite Ordnung umfassen könnte) der maximal erlaubten Verstärkungsregelung ist.
7 und 8 zeigen einen Typ von Ausführungsformen der vorliegenden Erfindung, 9 und 10 richten sich auf einen anderen Typ von Ausführungsformen.
Im Grunde enthalten diese Ausführungsformen 4, vorzugsweise 5, Elemente oder Schritte:

1. einen AVL (automatischen Lautstärke-Einpegler): der AVL ist ein signalabhängiger Verarbeitungsblock, der die Lautstärke des eintreffenden Signals auf einem nahezu konstanten Pegel hält,
2. ein Hochpassfilter erster Ordnung: dieses Filter entfernt einen Teil der niedrigeren Frequenzen, wodurch Kopfraum für die Verstärkung geschaffen wird,
3. eine Verstärkung: Steigerung des SPLs (Schalldruckpegel) des Signals,
4. einen begrenzer, vorzugsweise ein harter Begrenzer, wenn eine einfache Anordnung bevorzugt wird: das Signal wird auf eine bestimmte Amplitude begrenzt um einen linearen Betrieb des analogen Verstärkers zu gewährleisten (nach Digital-Analog-Umwandlung). Statt eines harten Begrenzers, der einfach das Signal über dem Begrenzungspegel anschneidet, kann auch ein weicher Begrenzer verwendet werden, der das Signal über einem Begrenzungspegel abschneidet, aber auch das Signal auf einem Pegel in der Nähe des Begrenzungspegels dämpft. Die Verwendung eines weichen Begrenzers stellt das dynamische Verhalten des Signals gewissermaßen wieder her, wodurch die Verständlichkeit gesteigert wird.
5. (vorzugsweise) ein Tiefpassfilter erster Ordnung: das Filter stellt das Gleichgewicht zwischen den Mittenfrequenzen und den hohen Frequenzen wieder her oder verbessert es wenigstens, wenn der Schall unnatürlich und ziemlich rau klingt; dieses Filter macht den verarbeiteten Schall zum Anhören angenehmer.

In diesem Beispiel ist der Eingang ein Spracheingang, aber es sei bemerkt, dass der Eingang jeder beliebige Schalleingang sein kann.
10 zeigt eine detaillierte Darstellung des AVL-Elementes.
10 zeigt das Blockschaltbild des AVLs. Teilung der maximalen Ausgangsamplitude (in 10 bezeichnet durch: "Reference Clipping Lin") durch den Absolutwert der maximalen Amplitude des Signals an dem ganzen Eingangsblock ergibt die Verstärkung, die ohne jegliche Begrenzung auf den Block angewandt werden kann, (durch "Instant gain" bezeichnet). Der Parameter "GainUpdate" ist typischerweise 1/1000. Auf diese Weise wird das Signal nach der Summe jeden Block um einen Betrag, abhängig von der "Instant gain" erhöht. Dadurch wird die AVL-Verstärkung für höhere Werte der "Instant gain" schneller gesteigert.
Da die mögliche Verstärkung, angewandt auf das Eingangssignal ("AVL gain" nicht höher sein soll als ("Instant gain"), wird die kleinere derselben genommen ("Min"). Der minimale Block gewährleistet auch, dass die AVL-Verstärkung unmittelbar verringert wird, wenn die Amplitude des eintreffenden Signals ansteigt. Um zu vermeiden, dass lautlose Stellen in dem Eingangssignal zu sehr verstärkt werden, wird das Signal nach einem minimalen Block begrenzt (typischerweise um 12 dB). Es sei bemerkt, dass da die maximale Ausgangsamplitude nicht unbedingt dem linearen Pegel entsprechend ist, der 0 dB darstellt, kann die AVL Verstärkung kleiner als 1 sein.
Zuletzt, wenn die Amplitude des Eingangssignals kleiner ist als ein bestimmter Wert, beispielsweise der Signal-Rausch-Boden, wird keine Verstärkung angewandt. Die ist eine sekundäre Funktionalität, bei bevorzugten Ausführungsformen, die auch als eine Funktionalität bei anderen Typen komprimierender Verstärker angewandt werden kann um zu vermeiden, dass schwache Eingangssignal verstärkt werden, Rauschanteile werden dann nicht verstärkt, was die Verständlichkeit des Schalls steigert.
Zahlenbeispiel:

– Abtastrate ist 8 kHz
– Blocklänge ist 80 Abtastwerte
– Wortlänge ist 16 Bit
– maximale Ausgangsamplitude ist 32768 (0 dB)
– Eingangssignal ist sinusförmig mit einer Amplitude 32768 (0 dB), Frequenz > 100 Hz wenigstens eine Sinusperiode je Block)
– aktuelle AVL Verstärkung ist 1 (0 dB)
– Verstärkungsaktualisierung = 0,001
– AVL Verstärkung ("Old value") ist auf 12 dB begrenzt.

Nun nimmt die Amplitude des Eingangssignals um 40 dB ab (Faktor 100 auf einer linearen Skala). Die nachfolgende Tabelle zeigt, wie die verschiedenen Signale innerhalb des AVLs sich mit der Zeit ändern.
Das AVL-Verhalten ist auch in 11 dargestellt.
Die linke Graphik zeigt die Schrittänderung der Amplitude der drei Eingangssignale. Die rechte Graphik zeigt, dass die AVL-Verstärkung für große Änderungen in der Amplitude schneller zunimmt. Dies ist eine bevorzugte Ausführungsform, welche die Verständlichkeit weiter verbessert.
12 zeigt ein Beispiel einer Kompressionsfunktion. Bis an einen bestimmten Wert wird das Signal unberührt gelassen (mit Eins multipliziert) und über diesem Wert wird die Amplitude des ausgelieferten Signals kleiner als die Amplitude des eingege benen Signals, d.h. das Signal wird komprimiert. Eine funktionelle Form, die nur Kompression in den höchsten Gebieten, wie in 12 anwendet, kann für den Begrenzer verwendet werden, während eine funktionelle Form, die eine Kompressionsstrategie über ein größeres Gebiet schafft (beispielsweise den ganzen Eingangsbereich), kann für den komprimierenden Verstärker verwendet erden.
Die vorliegende Erfindung kann in mehreren Anordnungen angewandt werden. Die vorliegende Erfindung ist insbesondere nützlich für Freisprechtelefone. Sie ist aber auch anwendbar für alle Tonwiedergabesysteme, insbesondere für diejenigen, die in einer Anordnung mit einer begrenzten Speisespannung und/oder mit einem kleinen Lautsprecher angewandt werden. Eine Liste etwaiger Applikationen:

– Handgeräte (Handys, DECT, usw.);
– tragbare Anordnungen, beispielsweise tragbare DVD-Spieler;
– PDAs,
– Car Kits
– Fernseher; Computer;
– Web-Terminals;
– Anrufbeantworter.

In den bisher gegebenen Beispielen sind die meisten oder alle Daten und Einstellungen für die jeweiligen Elemente fest. In bevorzugten Ausführungsformen der vorliegenden Erfindung aber sind die Einstellungen der jeweiligen Elemente an eine Messung des Umgebungslärms anpassbar. 13 zeigt ein derartiges Beispiel. Unter Verwendung einer Messanordnung 130 zum Messen von Hintergrundlärm, wie beispielsweise ein separates Mikrophon, und eines Adapters 131 werden die Einstellungen für ein oder mehrere verschiedene Elemente (AVL (Verstärkung), Hochpassfilter (Grenzfrequenz), Verstärkung (G), harte Begrenzung (Begrenzungspegel), Tiefpassfilter (Grenzfrequenz)) angepasst.
Die verschiedenen Anpassungen sich durch 132 bis 136 bezeichnet.
Die Lärmmessung kann einen einzigen Datenausdruck der gesamten Störung S geben oder sie kann eine Lärmzahl für verschiedene Rauschbänder S_f1, S_f2, S_f3 usw. geben. Wenn Lärmzahlen für verschiedene Rauschbänder gemessen werden kann ein mittlerer oder gesamter Rauschwert berechnet werden, beispielsweise S_av = ΣS_f1, oder gewichtet ent sprechend einer dB(A) Skala beispielsweise S_av = Σw_iS_f1, wobei w_i Gewichtungskoeffizienten der dB(A) Skala sind. Der Rauschpegel wird durch eine Amplitudenmessung gemessen.
Die verschiedenen Anpassungen werden anhand von Beispielen beschrieben.
132: Anpassungen der AVL-Einstellungen:
In dem AVL wird die AVL Verstärkung begrenzt (siehe 10, AVL Verstärkungsgrenze), und unterhalb eines bestimmten Pegels wird keine Verstärkung angewandt (siehe 10, Box unter dem erwähnt ist keine Verstärkung, wodurch der Rauschbodenschalter bestimmt wird). Abhängig von dem gemessenen Rauschwert S wird der Rauschbodenschalter gesteigert und die Begrenzung der AVL Verstärkung wird gesteigert.
133: Anpassungen an das Hochpassfilter:
Die Grenzfrequenz wird an den gemessenen Rauschwert angepasst. Je höher der Rauschpegel, umso höher die Grenzfrequenz. Für adaptive Ausführungsformen kann die Grenzfrequenz auf vorteilhafte Weise über einen größeren Bereich sich erstrecken als für nicht adaptive Ausführungsformen. Während für nicht adaptive Ausführungsformen die Grenzfrequenz auf vorteilhafte Weise zwischen 300 Hz und 2 kHz sich erstreckt, erstreckt sich für adaptive Ausführungsformen die Grenzfrequenz auf vorteilhafte Weise zwischen 50 Hz (für Situationen, in denen es im Wesentlichen keine Rauschwerte gibt) und typischerweise 2 kHz für Situationen mit einem hohen Rauschpegel.
In der adaptiven Verarbeitungsmode wird die Filtergrenzfrequenz auf diese Weise entsprechend dem Betrag an Umgebungslärm aktualisiert und erstreckt sich typischerweise von einem sehr niedrigen Wert, beispielsweise 50 Hz (kein Umgebungslärm) bis 20 kHz (starker Umgebungslärm). In lautstarken Umgebungen werden mehr niedriger Frequenzen entfernt um mehr Kopfraum zum Verstärkern des Signals nachher zu schaffen. Ein Maximum von 2 kHz wird empfohlen um eine Entfernung von Frequenzen zu vermeiden, die einen Beitrag zu der Verständlichkeit von Sprache liefern. Die Filterkoeffizienten werden in Laufzeit berechnet.
Die Beziehung zwischen der Grenzfrequenz und dem Rauschpegel wird vorzugsweise wie folgt eingestellt: f_cut-off = f₀ + Δf (S) wobei f₀ die untere Rauschgrenze ist (bei spielsweise (50, 100 oder 300 Hz) und Δf ist eine höher als lineare Funktion des Rauschpegels ist (proportional zu S', wobei i größer ist als 1).
In einer komplexeren Ausführungsform kann nicht nur die Grenzfrequenz von dem gemessenen Rauschpegel abhängig sein, sondern auch die Form der Filterfunktion, beispielsweise ob die Filterfunktion eine Filterfunktion erster oder zweiter Ordnung ist.
134: Anpassungen für die Verstärkung G.
Die Verstärkung G wird gesteigert, je nachdem der Rauschpegel steigt. Aber die Verstärkung steigt vorzugsweise nicht linear mit dem Rauschpegel, sondern vielmehr wie folgt:
G(S) = G₀ + cSⁱ, wobei 1 mehr ist als 1, beispielsweise 2 oder 3, und c eine Konstante ist, wobei c Null sein kann unterhalb eines Schwellenwertes von S. Eine einfache Beziehung ist beispielsweise G(S) = G₀ + cS², d.h. die Verstärkung ist nicht linear abhängig von dem Rauschwert, sondern bleibt auf dem Nennwert oder bleibt nahe an demselben um bei hohen Rauschpegeln schnell zuzunehmen.
Die Zunahme der Verstärkung hat einen positiven Effekt, aber auch einen negativen. Durch nicht lineare Steigerung der Verstärkung als eine nicht lineare Rauschfunktion, kann ein besseres Gleichgewicht zwischen dem positiven und negativen Effekt erzielt werden.
Der Wert der Verstärkung wird beispielsweise an den Betrag des Umgebungslärms angepasst (in der adaptiven Verarbeitungsmode), der sich von 0 dB bis +18 dB erstreckt.
135: Anpassungen für den Begrenzer:
Der Begrenzungsvorgang wird gesteigert, je nachdem der Rauschpegel ansteigt. Dies ist vorzugsweise eine nicht lineare Rauschfunktion. Der maximale Pegel, über dem das Signal begrenzt wird, kann für hohe Rauschpegel um 12 dB reduziert werden. So kann beispielsweise ohne Lärm der digitale Begrenzungspegel 0 dB sein, während bei hohen Rauschpegeln die Begrenzung auf –12 dB gesetzt wird.
136: Anpassungen für das Tiefpassfilter.
Beim Fehlen von Rauschwerten wird die Grenzfrequenz auf eine hohe Grenze gesetzt, beispielsweise F_s/2. Für maximale Rauschwerte wird die Grenzfrequenz auf eine niedrigere Grenze gesetzt, beispielsweise 2 kHz.
In der adaptiven Verarbeitungsmode wird die Filtergrenzfrequenz entsprechend dem Betrag an Umgebungslärm aktualisiert, und erstreckt sich beispielsweise von 3,900 kHz (kein Umgebungslärm) bis 2 kHz (starker Umgebungslärm) für Schmalbandsprachapplikationen (Abtastfrequenz ist 8 kHz). Die Filterkoeffizienten werden in Laufzeit berechnet.
Vorzugsweise ist das funktionelle Verhältnis zwischen dem gemessenen Rauschpegel und der Grenzfrequenz f_cut-offLP = L_0LP – Δf_LP, wobei Δf_LP eine nicht lineare Funktion des gemessenen Rauschpegels ist, beispielsweise proportional zu der Quadratur des Rauschpegels.
In diesen Ausführungsformen wird der verwendete Algorithmus entworfen um adaptiv zu arbeiten, betrieben durch den Betrag an Umgebungslärm (Nah-Ende). Dies führt zu einem benutzerfreundlichen Anordnungsmerkmal, das es ermöglicht, dass der Benutzer die Anordnung (beispielsweise eine GSM) unter verschiedenen Umständen in Bezug auf Umgebungslärm verwenden kann, ohne dass eine weitere Interaktion zur Steuerung des GSM Lautstärkepegels erforderlich ist.
Wenn in der adaptiven Verarbeitungsmode verwendet, werden die Parameter der Verarbeitungsblöcke für eintreffende Abtastwerte entsprechend dem Umgebungslärm angepasst. Der Algorithmus passt Parameter entsprechend dem Umgebungslärm an. Der Betrag an Lärm kann durch ein separates Mikrophon gemessen werden oder unter Verwendung des Anordnungsmikrophons (GSM) (für eine einzelne Mikrophonapplikation) geschätzt werden.
Das Hauptziel der vorliegenden Erfindung ist und bleibt Sprachverständlichkeit. Die hat eine höhere Priorität als die Natürlichkeit und die Wärme der Stimme. Wenn der Umgebungslärm abnimmt (wobei in der adaptiven Verarbeitungsmode gearbeitet wird), werden die Parameter vorzugsweise sehr schnell angepasst, so dass die Natürlichkeit und Wärme des eintreffenden Signals wiederhergestellt werden.
In der adaptiven Mode beeinflusst der Umgebungslärm die jeweiligen Verarbeitungsblockparameter. Der Lärm kann sich von "kein Umgebungslärm" bis "starker Umgebungslärm" erstrecken.
Der Term "kein Umgebungslärm" bedeutet nicht eine völlige Stille, sondern normale Geräusche wie Ventilatorgeräusche, Hintergrundmusik, usw. In einer typischen Umgebung ist der Hintergrundlärm typischerweise um 50 dB (A). Der Term "starker Hintergrundlärm" bezieht sich auf den Lärm eines vorüber donnernden Zuges, Lärm innerhalb einer Disko, usw. Dieser Lärm kann auf 100 dB (A) gemessen werden.
Der Lärm kann durch Messung der spektralen Amplitudeninformation des Umgebungslärms gemessen werden und durch Berechnung eines einzigen Wertes, der den Lärmbetrag darstellt. Ein oder mehrere, vorzugsweise die meisten, aber noch besser alle Parameter der jeweiligen Elemente (AVL, Hochpassfilter, Verstärker, Begrenzer, Tiefpassfilter) werden entsprechend diesem einzigen Wert durch Interpolation zwischen den minimalen und maximalen Wert angepasst.
Wie oben erläutert, ist diese Interpolation nicht unbedingt linear. Tests, bei denen lineare Interpolation angewandt wurden, zeigten, dass für "mittleren" Umgebungslärm der Algorithmuseffekt zu groß war.
Durch Anwendung einer höheren Interpolation, beispielsweise zweiter oder dritter Ordnung, ist der Effekt im Vergleich zu der linearen Interpolation für denselben Umgebungslärm linear. Für starken Umgebungslärm ist der Effekt gleich.
14 zeigt das adaptive Verhalten eines Parameters (beispielsweise die Verstärkung G, eine Grenzfrequenz, den Begrenzungspegel). Der Parameter P variiert in diesem Beispiel zwischen einem niedrigeren Grenzwert P_low in diesem Beispiel 2, und einem hohen Grenzwert P_high, in diesem Beispiel 7, als eine Funktion des gemessenen Rauschpegels, in diesem Beispiel der mittleren Rauschamplitude S. Die jeweiligen Kurven mit der Bezeichnung 1, 2 und 3 geben eine Abhängigkeit des Parameters erster (linear), zweiter (quadratisch) und dritter Ordnung von dem gemessenen Rauschpegel. Je höher die Ordnung, umso ausdrücklicher der adaptive Effekt bei hohe Rauschpegeln.
Zusammengefasst kann die vorliegende Erfindung wie folgt beschrieben werden:
Ein Tonwiedergabesystem umfasst einen digitalen Audiosignaleingang (1), einen digitalen Audiosignalprozessor (2, DSP) und einen digitalen Audiosignalausgang (1), wobei der digitale Signalprozessor (2, DSP) ein Hochpassfilter (21) mit einer Durchlassfrequenz (f) zwischen 300 Hz und 2 kHz, einen Kompressionsverstärker (22) zur Kompression und Verstärkung eines Signals innerhalb eines Signalamplitudenbereichs und einen Begrenzer zum begrenzen des Signals über einem Begrenzungspegel, und vorzugsweise ein Tiefpassfilter (23) zum Filtern des von dem Kompressionsverstärker gelieferten Signals und zum Schaffen eines Ausgangssignals aufweist, wobei die Durchlassfrequenz des Tiefpassfilters (f) in dem Bereich von 2 kHz-Fs/2 liegt, wobei Fs die Abtastfrequenz ist. Fs/2 kann beispielsweise 4 kHz sein.
Im Rahmen der vorliegenden Erfindung, wie in den beiliegenden Patentansprüchen definiert, sind viele weitere Abwandlungen möglich.
Text in der Zeichnung.
3

Größe (dB)
Frequenz (kHz)

7

Eingang
Hochpassfilter
HP Eingang
AVR Ausgang
HP Ausgang
Begrenzer
Aus
Tiefpassfilter
Ausgang

8

HP Eingang
HP Ausgang
Teilen
Multiplizieren
Produkt
AVR Ausgang

9

Spracheingang
HP Filter
Verstärkung
Harte Begrenzung
Tiefpassfilter
Sprachausgang

10

Eingangssignal Teilung
Verstärkungsaktualisierung
Eingangssignal
Keine Verstärkung
Anwendung AVL Verstärkung
AVL Ausgang

11

AVL Eingangsamplitudenschritt
Eingangsamplitude (dB)
Zeit
AVL Verstärkung
Zeit

13

Spracheingang
Umschaltung zur Umleitung des Hochpassfilters
Umschaltung zur Umleitung des Tiefpassfilters
Verstärkung
Harte Begrenzung
Tiefpassfilter
Sprachausgang

Claims

Tonwiedergabesystem mit einem digitalen Audiosignaleingang (1), einem digitalen Audiosignalprozessor (2, DSP) und einem digitalen Audiosignalausgang (1), wobei der digitale Signalprozessor (2, DSP) ein Hochpassfilter (HP) (21) mit einer Durchlassfrequenz (f) zwischen einer ersten und einer zweiten Frequenz aufweist, ein Kompressionsverstärker (22) zur Kompression und Verstärkung eines Signals, wobei wenigstens die Verstärkung nach der HP-Filterung durchgeführt wird, und einen Amplitudenbegrenzer zum Begrenzen des HP-gefilterten, komprimierten und verstärkten Signals über einem Begrenzungspegel.
Tonwiedergabesystem nach Anspruch 1, wobei die Durchlassfrequenz (f) eine Frequenz zwischen 300 Hz und 2 kHz ist.
Tonwiedergabesystem nach Anspruch 1, wobei das Hochpassfilter ein Filter erster oder zweiter Ordnung ist.
Tonwiedergabesystem nach Anspruch 1, wobei die Anordnung eine Messanordnung (130) aufweist zum Messen von Hintergrundrauschen und einen Adapter (131) zum Anpassen eines oder mehrerer Parameter (f, order) für das Hochpassfilter (HP).
Tonwiedergabesystem nach Anspruch 4, wobei die Durchlassfrequenz zwischen 50 Hz und 2 kHz anpassbar ist.
Tonwiedergabesystem nach Anspruch 1, wobei der komprimierende Verstärker dazu vorgesehen ist, ein Signal mit einer Signalstärke unterhalb eines Schwellenwertes nicht zu verstärken.
Tonwiedergabesystem nach Anspruch 1, wobei die Anordnung eine Messanordnung 130 zum messen von Hintergrundrauschen und einen Adapter 131 zum Anpas sen eines oder mehrerer Parameter für den Kompressionsverstärker (22) aufweist.
Tonwiedergabesystem nach Anspruch 1, wobei der digitale Audioprozessor ein Tiefpassfilter (23) zum Filtern des von dem Kompressionsverstärker gelieferten Signals und zum Liefern eines Ausgangssignals, wobei die Durchlassfrequenz des Tiefpassfilters (f) in dem Bereich 2 kHz-Funkstation/2 liegt, wobei Funkstation die Abtastfrequenz ist.
Tonwiedergabesystem nach Anspruch 8, wobei die Anordnung eine Messanordnung 130 aufweist zum Messen von Hintergrundrauschen und einen Adapter 131 zum Anpassen eines oder mehrerer Parameter (f) für das Tiefpassfilter.
Tonwiedergabesystem nach Anspruch 9, wobei das System ein Mittel aufweist zum Aktivieren und/oder Einstellen der Frequenzabhängigkeit des Tiefpassfilters von der Verstärkung in dem Kompressionsverstärker.
Tonwiedergabesystem nach einem der Ansprüche 4, 7 oder 9, wobei der eine oder mehrere der genannten Parameter eine nicht lineare Funktion des gemessenen Rauschpegels ist.
Tonwiedergabesystem nach Anspruch 1, wobei das System das Hochpassfilter mit einer nachfolgenden AVR und einem nachfolgenden Begrenzer aufweist.
Tonwiedergabesystem nach Anspruch 1, wobei das System einen automatischen Lautstärkegleichmacher aufweist, dem das Hochpassfilter vorhergeht oder, vorzugsweise, folgt, der ein gleichgemachtes Signal liefert, wonach eine Verstärkung und eine Begrenzung folgt.
Verfahren zum Verarbeiten digitaler Tonsignale, wobei in diesem Verfahren Frequenzanteile des Tonsignals, niedriger als eine Grenzfrequenz (f) zwischen einer ersten und einer zweiten Frequenz gedämpft werden, wobei die Tonsignale verstärkt werden und komprimiert bis innerhalb einer Signalbandbreite und über einem Begrenzungspegel innerhalb der Signalbandbreite begrenzt werden.
Verfahren nach Anspruch 14, wobei die Grenzfrequenz zwischen 300 Hz und 2 kHz liegt.
Verfahren nach Anspruch 14, wobei ein Rauschpegel gemessen wird und die Grenzfrequenz (f) in Abhängigkeit von dem gemessenen Rauschpegel (S) bestimmt wird.
Verfahren nach Anspruch 16, wobei die Grenzfrequenz durch eine nichtlineare Funktion des Rauschpegels (S) bestimmt wird.
Verfahren nach Anspruch 16, wobei die Grenzfrequenz zwischen 50 Hz und 2 kHz liegt.
Verfahren nach Anspruch 14, wobei nach Kompression und Begrenzung Frequenzanteile des resultierenden digitalen Signals unterhalb einer Grenzfrequenz f zwischen 2 kHz und 4 kHz gedämpft werden.
Verfahren nach Anspruch 19, wobei ein Rauschpegel gemessen wird und die Grenzfrequenz (f) in Abhängigkeit von dem gemessenen Rauschpegel (S) bestimmt wird.
Verfahren nach Anspruch 20, wobei die Grenzfrequenz (f) durch eine nicht lineare Funktion des Rauschpegels (S) bestimmt wird.
Verfahren nach Anspruch 14, wobei Aktivierung und/oder Einstellung der Frequenzabhängigkeit des Tiefpassfilters in Abhängigkeit von der Verstärkung in dem begrenzenden Verstärkungsschritt durchgeführt wird.
Computerprogramm mit Programmcodemitteln zum Durchführen eines Verfahrens nach einem der Ansprüche 14 bis 22, wenn das genannte Programm in einem Computer läuft.
Computerprogrammprodukt mit Programmcodemitteln, die auf einem vom Computer auslesbaren Medium gespeichert sind zum Durchführen eines Verfahrens nach einem der Ansprüche 14 bis 22.