DE10052626A1 - Adaptiver Geräuschpegelschätzer - Google Patents
Adaptiver GeräuschpegelschätzerInfo
- Publication number
- DE10052626A1 DE10052626A1 DE10052626A DE10052626A DE10052626A1 DE 10052626 A1 DE10052626 A1 DE 10052626A1 DE 10052626 A DE10052626 A DE 10052626A DE 10052626 A DE10052626 A DE 10052626A DE 10052626 A1 DE10052626 A1 DE 10052626A1
- Authority
- DE
- Germany
- Prior art keywords
- value
- noise level
- input signal
- determined
- estimate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000003044 adaptive effect Effects 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 51
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 6
- FEPMHVLSLDOMQC-UHFFFAOYSA-N virginiamycin-S1 Natural products CC1OC(=O)C(C=2C=CC=CC=2)NC(=O)C2CC(=O)CCN2C(=O)C(CC=2C=CC=CC=2)N(C)C(=O)C2CCCN2C(=O)C(CC)NC(=O)C1NC(=O)C1=NC=CC=C1O FEPMHVLSLDOMQC-UHFFFAOYSA-N 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 230000008054 signal transmission Effects 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000006978 adaptation Effects 0.000 abstract description 6
- 230000002123 temporal effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 235000010678 Paulownia tomentosa Nutrition 0.000 description 1
- 240000002834 Paulownia tomentosa Species 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Noise Elimination (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Control Of Amplification And Gain Control (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Monitoring And Testing Of Exchanges (AREA)
Abstract
Ein Verfahren zur Ermittlung eines Schätzwerts für den Geräuschpegel n eines einem akustischen Nutzsignal überlagerten Hintergrundgeräusches ist dadurch gekennzeichnet, dass der Schätzwert n(x) für ein abgetastetes Eingangssignal x(k) als ein Wert n1(x) bestimmt wird, der durch den Minimalwert aus der Menge aller sukzessive jeweils innerhalb eines Kurzzeitintervalls ts >= 1ms gefundenen Maximumwerte des Eingangssignals x(k) ermittelt wird; dass der Wert n1(x) als Schätzwert n(x) für den aktuellen Geräuschpegel n übernommen wird, wenn die dynamischen Variationen des Eingangssignals x(k) einen Schwellwert epsilon unterschreiten; und dass anderenfalls der im vorhergehenden Schritt ermittelte Schätzwert ungeändert als neuer Schätzwert n(x) übernommen wird. Damit kann eine äußerst exakte Ermittlung des aktuellen Geräuschpegels mit sehr schnellen Adaptionszeiten erreicht werden, die erheblich geringer sind als bei bekannten Verfahren, wobei nur ein relativ geringer Rechenaufwand erforderlich ist.
Description
Die Erfindung betrifft ein Verfahren zur Ermittlung eines Schätzwerts für den
Geräuschpegel n eines Hintergrundgeräusches, das einem über ein
Telekommunikations(= TK)-System übertragenen akustischen Nutzsignal,
insbesondere einem menschlichen Sprachsignal überlagert ist. Weiter betrifft
die Erfindung auch Computerprogramme und Vorrichtungen zur Unterstützung
und Durchführung eines derartigen Verfahrens, insbesondere geeignete
Servereinheiten, Signalisierungseinrichtungen, Prozessorbaugruppen und
programmierbare Gate-Array-Baugruppen.
Verfahren zur Geräuscheinschätzung von Hintergrundgeräuschen sind bekannt.
Beispielsweise werden Geräuschschätzer verwendet, bei denen für die Schät
zung des Geräuschpegels eines Signals der in einem Kurzzeitintervall gemit
telte Wert des Signals (SAM = short average magnitude) verwendet wird.
Bei anderen Verfahren wird in längeren Zeitintervallen der sogenannte
MAM(= medium average magnitude)-Wert eines Eingangssignales gemessen.
Um ein verlässliches Resultat der Schätzung zu erreichen, sind Messzeiten bis
zu 500 ms erforderlich. Oft spiegelt auch der MAM-Wert einen zu hohen
Geräuschpegel im Vergleich mit dem tatsächlichen Geräuschpegel vor.
Allgemein ist der Wert des Geräuschpegels eines Signals für viele Allgorithmen
zur Signalbearbeitung als Schwellenwert oder Steuerwert von großer Bedeu
tung. Die Zuverlässigkeit und das zeitliche Verhalten eines Geräuschschätzers
haben einen großen Einfluss auf die erreichbare Qualität eines Signalbearbei
tungs-Allgorithmus. Dies gilt insbesondere auf dem Gebiet der Spracherken
nung, um die Erkennungsrate zu verbessern, auf dem Gebiet der Echounter
drückung und für die Geräuschreduktion. Anwendungsgebiete für Geräusch
schätzer sind beispielsweise Vermittlungsanlagen, Konferenzeinrichtungen,
aber auch herkömmliche Telefone oder Handys.
Nachteilig bei bekannten Schätzverfahren ist das relativ langsame Verhalten bei
der Mittelung im Geräuschschätzer. Gerade bei Sprachaktivität mit nur kurzen
Sprachpausen in Zeiträumen von < 100 ms reicht oftmals die Zeit nicht aus, um
den "Geräuschboden" zu erfassen.
Nach der ITU-T-Richtlinie G.168 werden sogenannte "composite signals" ver
wendet, die aus einer Folge von Signalbursts mit einer Pausenzeit von
ca. 100 ms bestehen. Auch hier ist mit den bisher bekannten Verfahren keine
exakte Geräuschschätzung möglich.
Ein weiteres Problem der Geräuschschwelle ist die bei erfolgreicher Sprach
pegelschätzung durchgeführte Geräuschaktualisierung bei zeitlich sich ändern
den Umweltbedingungen. Der geschätzte Geräuschwert schwankt somit in
gewissen, manchmal relativ großen Grenzen.
Aufgabe der vorliegenden Erfindung ist es demgegenüber, ein Verfahren der
eingangs beschriebenen Art mit möglichst einfachen Mitteln dahingehend
weiterzubilden, dass eine möglichst exakte Ermittlung des aktuellen Geräusch
pegels mit möglichst schnellen Adaptionszeiten erreicht wird, die erheblich
geringer sind als bei bekannten Verfahren, und dass dazu ein möglichst gerin
ger Rechenaufwand erforderlich ist.
Erfindungsgemäß wird diese Aufgabe auf ebenso überraschend einfache wie
wirkungsvolle Art und Weise dadurch gelöst,
dass in einem ersten Schritt ein vorgebbarer Initialisierungswert n0 als Schätz wert n(x) für einen aktuellen Geräuschpegel n angenommen wird;
dass im nächsten und ggf. in weiteren Schritten der Schätzwert n(x) des Geräuschpegels n für ein in vorzugsweise äquidistanten Zeitschritten T jeweils zu Zeitpunkten k mit einer Abtastfrequenz fs = 1/T abgetastetes Eingangssignal x(k) als ein Wert n1(x) bestimmt wird, der durch den Minimalwert aus der Menge aller sukzessive jeweils innerhalb eines Kurzzeitintervalls mit einer zeit lichen Länge ts ≧ 1 ms, vorzugsweise ts ≧ 3 ms gefundenen Maximumwerte des Eingangssignals x(k) ermittelt wird;
dass der Wert n1(x) als Schätzwert n(x) für den aktuellen Geräuschpegel n übernommen wird, wenn die dynamischen Variationen des Eingangssignals x(k) einen vorgebbaren Schwellwert ε unterschreiten; und
dass der im vorhergehenden Schritt ermittelte Schätzwert n(x) ungeändert als neuer Schätzwert n(x) für den aktuellen Geräuschpegel n übernommen wird, wenn die dynamischen Variationen des Eingangssignals x(k) einen vorgeb baren Schwellwert ε überschreiten.
dass in einem ersten Schritt ein vorgebbarer Initialisierungswert n0 als Schätz wert n(x) für einen aktuellen Geräuschpegel n angenommen wird;
dass im nächsten und ggf. in weiteren Schritten der Schätzwert n(x) des Geräuschpegels n für ein in vorzugsweise äquidistanten Zeitschritten T jeweils zu Zeitpunkten k mit einer Abtastfrequenz fs = 1/T abgetastetes Eingangssignal x(k) als ein Wert n1(x) bestimmt wird, der durch den Minimalwert aus der Menge aller sukzessive jeweils innerhalb eines Kurzzeitintervalls mit einer zeit lichen Länge ts ≧ 1 ms, vorzugsweise ts ≧ 3 ms gefundenen Maximumwerte des Eingangssignals x(k) ermittelt wird;
dass der Wert n1(x) als Schätzwert n(x) für den aktuellen Geräuschpegel n übernommen wird, wenn die dynamischen Variationen des Eingangssignals x(k) einen vorgebbaren Schwellwert ε unterschreiten; und
dass der im vorhergehenden Schritt ermittelte Schätzwert n(x) ungeändert als neuer Schätzwert n(x) für den aktuellen Geräuschpegel n übernommen wird, wenn die dynamischen Variationen des Eingangssignals x(k) einen vorgeb baren Schwellwert ε überschreiten.
Mit dem erfindungsgemäßen Verfahren wird also jeweils in einem Kurzzeit
intervall der Länge ts ein Maximumwert aus den Abtastwerten des Eingangs
signals x(k) bestimmt und für die Abschätzung des aktuellen Geräuschpegels
aus der Menge mehrerer hintereinander gefundener Maximumwerte jeweils das
Minimum n1(x) als Schätzwert n(x) für den aktuellen Geräuschpegel n heran
gezogen. Um bereits vor der ersten Messperiode einen Schätzwert n(x) bereit
zustellen, wird ein Initialisierungswert n0 vorgegeben.
Falls die dynamischen Variationen des Eingangssignals, insbesondere hervor
gerufen durch große Änderungen im Geräuschhintergrund, wie beispielsweise
das Zuschlagen einer Tür, das Vorbeifahren eines Lastwagens etc. einen
gewissen vorgebbaren Schwellwert ε überschreiten, wird das Schätzverfahren
gewissermaßen "angehalten" und jeweils der letzte Schätzwert übernommen,
bei dem die Dynamik des Eingangssignals x(k) unterhalb des vorgegebenen
Schwellenwerts ε lag. Damit wird verhindert, dass erratische Schätzwerte auf
Grund schneller Schwankungen im Signal zustandekommen. Das
erfindungsgemäße Verfahren erreicht nämlich eine äußerst schnelle Adaption
auf den aktuellen Geräuschpegel in Zeiträumen von etwa 10 ms, im Gegensatz
zu den oben erwähnten bekannten Verfahren, die dazu Zeiten in der
Größenordnung von 500 ms benötigen.
Es zeigt sich, dass mit dem erfindungsgemäßen Verfahren insbesondere auch
eine korrekte Berechnung bei Anwendung der oben erwähnten G168
"composite signals" mit exakter Ermittlung des Geräuschpegels und sehr
schnellen Adaptionszeiten bei äußerst geringem Rechenaufwand ermöglicht
wird.
Besonders bevorzugt ist eine Ausführungsform des erfindungsgemäßen Verfah
rens, bei der das Zeitintervall ts = 1/fug gewählt wird, wobei fug die untere
Grenzfrequenz des übertragenden TK-Systems ist. Damit kann dem Hüll
kurvenverlauf der Eingangssignale optimal gefolgt werden.
Insbesondere sollte die zeitliche Länge ts jeweils so gewählt werden, dass eine
Adaption von niederfrequenten Signalen im Bereich < 100 Hz ausgeschlossen
wird. Üblicherweise liegen die unteren Grenzfrequenzen in einem Bereich fug ≦
500 Hz. Bei üblichen Telefoniesystemen beispielsweise beträgt die untere
Grenzfrequenz 330 Hz. Ein Wert von etwa 10 Hz als Untergrenze für die untere
Grenzfrequenz fug entspricht dem Wert eines üblichen HiFi-Verstärkers und ist
von daher vernünftig.
Vorteilhaft für die Durchführung des erfindungsgemäßen Verfahrens ist eine
Variante, bei der als Initialisierungswert n0 der maximal darstellbare Wert des
Zielsystems für die Signalübertragung innerhalb des TK-Systems gewählt wird.
Eine weitere vorteilhafte Variante des erfindungsgemäßen Verfahrens zeichnet
sich dadurch aus, dass für die Bestimmung des Schätzwerts n(x) der Wert n1(x)
auf einen vorgebbaren oder festen unteren Grenzwert nmin gesetzt wird, falls ein
Wert n1(x) < nmin ermittelt wird. Dadurch werden Fehleinschätzungen auf ein
fache Weise zuverlässig verhindert und somit eine höhere Genauigkeit des
Schätzwerts auf Grund der Bereichseinschränkung erzielt.
Dies gilt auch im Hinblick auf eine Obergrenze, die eingeführt werden sollte, um
eine verzerrungsfreie Signalübertragung zu gewährleisten. Entsprechend ist bei
einer weiteren Variante des erfindungsgemäßen Verfahrens vorgesehen, dass
für die Bestimmung des Schätzwerts n(x) der Wert n1(x) auf einen vorgebbaren
oder festen oberen Grenzwert nmax gesetzt wird, falls ein Wert n1(x) < nmax
ermittelt wird.
Besonders bevorzugt ist eine Weiterbildung dieser Verfahrensvariante, bei der
der obere Grenzwert nmax kleiner oder gleich dem Initialisierungswert n0
gewählt wird, vorzugsweise nmax ≦ n0 - 16 dB. Für eine lineare, verzerrungsfreie
Signalübertragung im betreffenden TK-System ist dieser obere Grenzwert durch
die statistisch ermittelte Sprachdynamik menschlicher Sprache vorgegeben.
Eine weitere vorteilhafte Ausführungsform des erfindungsgemäßen Verfahrens
sieht vor, dass die innerhalb der Kurzzeitintervalle gefundenen Maximumwerte
des Eingangssignals x(k) mit einem Skalierungsfaktor S < 1 multipliziert in die
Ermittlung des Werts n1(x) eingehen. Die Mehrzahl der tatsächlichen Pegel
werte liegt nämlich tatsächlich unterhalb des jeweils ermittelten Maximumwerts
innerhalb des betreffenden Kurzzeitintervalls.
Wird der Skalierungsfaktor S ≅ 0,5 gewählt, so entspricht dies in etwa der Lage
des Maximalwerts einer statistischen Verteilung, beispielsweise einer Gauß-
Verteilung der Abtastwerte im Verhältnis zur Lage des gefundenen maximalen
Pegelwerts. Dadurch wird der wirkliche aktuelle Geräuschpegel n im Mittel
erheblich besser getroffen als durch die Verwendung des unskalierten
Maximumwertes.
Für Anwendungen des erfindungsgemäßen Verfahrens zur sicheren Sprach-
Pausen-Detektion ist es vorteilhaft, wenn der Schätzwert n(x) als Maß für einen
aktuell abgeschätzten Geräuschpegel mit einem Faktor D < 1 skaliert wird.
Durch Simulation wurden als günstigste Werte für den Faktor D anwendungs
abhängig Werte im Bereich 2 ≦ D ≦ 5, vorzugsweise 3 ≦ D ≦ 4 gefunden. Damit
ergibt sich übrigens ein Abstand von ca. 6 dB zwischen dem Sprachsignal und
dem statistisch gemittelten Geräuschsignal, was allgemein als akzeptabler Stör
abstand gilt.
Besonders bevorzugt ist auch eine Ausführungsform des erfindungsgemäßen
Verfahrens, bei der ein fester Schwellwert ε = const. eingestellt wird, vorzugs
weise ε ≈ 12 dB. Mit diesem durch Simulationen gewonnenen Wert lassen sich
die meisten praktischen Anwendungsfälle gut abdecken.
Alternativ zur Einführung eines festen Schwellwertes ε kann bei einer anderen
vorteilhaften Verfahrensvariante der Schwellwert ε = ε(x) adaptiv mit der
Rauhigkeit des Pegels des Eingangssignals x(k) verändert werden. Damit lässt
sich eine optimale und äußerst schnelle Aktualisierung und Anpassung des
geschätzten Pegelwertes an die tatsächlichen Geräuschverhältnisse erreichen.
Vorteilhafterweise kann bei einer Weiterbildung dieser Verfahrensvariante für
den adaptiv zu ermittelnden Schwellwert ε(x) ein Startwert ε0 = 12 dB gewählt
werden, wie er bei der oben beschriebenen alternativen Verfahrensvariante als
unveränderlicher Festwert vorgeschlagen wird.
In den Rahmen der vorliegenden Erfindung fällt auch eine Servereineit, eine
Prozessor-Baugruppe sowie eine Gate-Array-Baugruppe zur Unterstützung des
oben beschriebenen erfindungsgemäßen Verfahrens sowie ein Computerpro
gramm zur Durchführung des Verfahrens. Das Verfahren kann sowohl als Hard
wareschaltung, als auch in Form eines Computerprogramms realisiert werden.
Heutzutage wird eine Software-Programmierung für leistungsstarke DSP's
bevorzugt, da neue Erkenntnisse und Zusatzfunktionen leichter durch eine
Veränderung der Software auf bestehender Hardwarebasis implementierbar
sind. Verfahren können aber auch als Hardwarebausteine beispielsweise in IP-
oder TK-Endgeräten oder herkömmlichen Telefonanlagen implementiert
werden.
Weitere Vorteile der Erfindung ergeben sich aus der Beschreibung und der
Zeichnung. Ebenso können die vorstehend genannten und die noch weiter auf
geführten Merkmale erfindungsgemäß jeweils einzeln für sich oder zu mehreren
in beliebigen Kombinationen Verwendung finden. Die gezeigten und beschrie
benen Ausführungsformen sind nicht als abschließende Aufzählung zu ver
stehen, sondern haben vielmehr beispielhaften Charakter für die Schilderung
der Erfindung.
Die Erfindung ist in der Zeichnung dargestellt und wird anhand von Ausfüh
rungsbeispielen näher erläutert.
Die Figur zeigt ein stark schematisiertes Prinzipbild der Funktionsweise einer
Schätzeinrichtung zur Durchführung des erfindungsgemäßen Verfahrens.
Ausgehend von einem Initialisierungswert n0 wird in einem ersten Kurzzeit
intervall der zeitlichen Länge ts ≧ 1 ms aus einem abgetasteten Eingangssignal
x(k) ein erster geschätzter Wert n1(x) für den Geräuschpegel n, der aus einem
Nutzsignal im Eingangssignal x(k) überlagerten Hintergrundgeräusches gemäß
folgender Gleichung berechnet:
Dabei ist K = fs/fug der Quotient aus der Abtastfrequenz des abgetasteten Ein
gangssignales x(k) und der unteren Grenzfrequenz fug des übertragenden TK-
Systems. Die Länge des Kurzzeitintervalls ergibt sich zu ts = 1/fug. Damit wird
über den Laufindex k das kleinste Zeitintervall dargestellt, das beobachtet wer
den muss, um nicht auf niederfrequente Signale zu adaptieren.
Der Wert n1(x) wird also aus dem Minimum eines vorhergehenden Wertes
n1(x) bzw. einem Initialisierungswert n0 und des Maximumwertes der mit einem
Skalierungsfaktor S ≈ 0,5 skalierten Beträge des Eingangssignals x(k) im Inter
vall k = 0 bis k = K gewonnen.
Für den Fall, dass Sprachaktivität im Eingangssignal x(k) vorliegt, wird als
Wert n1(x) ein vom Sprachpegel abhängiger Wert angenommen, da ja der
Sprachpegel lauter ist als das Geräusch. Akzeptabel ist beispielsweise ein
Störabstand von 6 dB.
Der so gefundene Wert n1(x) ändert sich zwar noch mit der Sprache, reagiert
aber auf Geräuschreduktion und während Sprachpausen mit extrem kurzer
Adaptionszeit.
Als eigentlicher Schätzwert n(x) für den aktuellen Geräuschpegel n wird der
oben beschriebene Wert n1(x) nur dann übernommen, wenn die dynamischen
Variationen des Eingangssignals x(k) einen vorgebbaren Schwellenwert ε unter
schreiten, wenn also gilt,
dx(i) . . . dx(i-ts) < ε (2)
Diese Bedingung kontrolliert dynamische Pegelschwankungen des zu unter
suchenden Signals. Beispielsweise mit einem Wert ε = 12 dB wird eine Aktuali
sierung des Geräuschsignals bei Pegelschwankungen < 12 dB verhindert. In
diesem Falle wird einfach der vorhergehende Schätzwert unverändert für den
aktuellen Geräuschpegel n übernommen. Dies ist beispielsweise dann der Fall,
wenn sich das Hintergrundgeräusch schlagartig erhöht oder absenkt, so dass
der Sprachpegelschätzer aktiv werden muss. Damit kann ausgeschlossen wer
den, dass Geräusch- oder Sprachspitzen den Schätzwert n(x) in erratischer Wei
se in kurzen Zeitabständen verändern.
Die oben beschriebenen dynamischen Pegelschwankungen dx(i) können beispiels
weise aus der Differenz sukzessive aufeinanderfolgender Kurzzeitmittelwerte sam(i)
ermittelt werden gemäß
dx(i) = sam(i) - sam(i-1) (3)
Falls nun die Hüllkurve der eingehenden Eingangssignale x(i) "stabil" ist, also
mit an Sicherheit grenzender Wahrscheinlichkeit keine Sprachsignale vorliegen,
können die aktuellen Pegelwerte direkt dem Hintergrundgeräusch zugeordnet
werden. Andernfalls, wenn die Hüllkurve "wackelt", liegt mit großer Wahrschein
lichkeit Sprache, also überwiegendes Nutzsignal im Eingangssignal x(i) vor, so
dass die Spitzen des Eingangssignals nicht für die Abschätzung des Geräusch
hintergrunds verwendet werden können. In diesem Fall muss dann, wie oben
beschrieben, aus dem Sprachsignal selbst ein skalierter Geräuschwert gewon
nen werden.
Die Zeichnung zeigt nun diesen Vorgang in schematisierter Weise, insbesonde
re die Maximumbildung aus dem Eingangssignal x(k), die Skalierung mit einem
Skalierungsfaktor S und die Minimumbildung zur Gewinnung des Wertes n1(x),
die Übernahme dieses Wertes in Abhängigkeit von einem Sprach-Pausen-
Detektor (SPD), dessen Ausgangswert gegebenenfalls mit einem anwendungs
abhängigen Faktor D skaliert wird, sowie die Schwellwertabschätzung der dyna
mischen Variationen des Eingangssignals x(k), die im dargestellten Beispiel aus
der zeitlichen Änderung des Kurzzeitmittelwerts dsam(x)/dt gewonnen werden.
Als Ausgangssignal dieses Verfahrens ergibt sich dann der gewünschte aktuali
sierte Schätzwert n(x) für einen tatsächlichen Geräuschpegel n.
Claims (18)
1. Verfahren zur Ermittlung eines Schätzwerts für den Geräuschpegel
n eines Hintergrundgeräusches, das einem über ein
Telekommunikations(= TK)-System übertragenen akustischen
Nutzsignal, insbesondere einem menschlichen Sprachsignal
überlagert ist,
dadurch gekennzeichnet,
dass in einem ersten Schritt ein vorgebbarer Initialisierungswert n0 als Schätzwert n(x) für einen aktuellen Geräuschpegel n angenommen wird;
dass im nächsten und ggf. in weiteren Schritten der Schätzwert n(x) des Geräuschpegels n für ein in vorzugsweise äquidistanten Zeitschritten T jeweils zu Zeitpunkten k mit einer Abtastfrequenz fs = 1/T abgetastetes Eingangssignal x(k) als ein Wert n1(x) bestimmt wird, der durch den Minimalwert aus der Menge aller sukzessive jeweils innerhalb eines Kurzzeitintervalls mit einer zeitlichen Länge ts ≧ 1 ms, vorzugsweise ts ≧ 3 ms gefundenen Maximumwerte des Eingangssignals x(k) ermittelt wird;
dass der Wert n1(x) als Schätzwert n(x) für den aktuellen Geräuschpegel übernommen wird, wenn die dynamischen Variationen des Eingangssignals x(k) einen vorgebbaren Schwellwert ε unterschreiten;
und dass der im vorhergehenden Schritt ermittelte Schätzwert n(x) ungeändert als neuer Schätzwert n(x) für den aktuellen Geräuschpegel n übernommen wird, wenn die dynamischen Variationen des Eingangssignals x(k) einen vorgebbaren Schwellwert ε überschreiten.
dass in einem ersten Schritt ein vorgebbarer Initialisierungswert n0 als Schätzwert n(x) für einen aktuellen Geräuschpegel n angenommen wird;
dass im nächsten und ggf. in weiteren Schritten der Schätzwert n(x) des Geräuschpegels n für ein in vorzugsweise äquidistanten Zeitschritten T jeweils zu Zeitpunkten k mit einer Abtastfrequenz fs = 1/T abgetastetes Eingangssignal x(k) als ein Wert n1(x) bestimmt wird, der durch den Minimalwert aus der Menge aller sukzessive jeweils innerhalb eines Kurzzeitintervalls mit einer zeitlichen Länge ts ≧ 1 ms, vorzugsweise ts ≧ 3 ms gefundenen Maximumwerte des Eingangssignals x(k) ermittelt wird;
dass der Wert n1(x) als Schätzwert n(x) für den aktuellen Geräuschpegel übernommen wird, wenn die dynamischen Variationen des Eingangssignals x(k) einen vorgebbaren Schwellwert ε unterschreiten;
und dass der im vorhergehenden Schritt ermittelte Schätzwert n(x) ungeändert als neuer Schätzwert n(x) für den aktuellen Geräuschpegel n übernommen wird, wenn die dynamischen Variationen des Eingangssignals x(k) einen vorgebbaren Schwellwert ε überschreiten.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass
ts = 1/fug, wobei fug die untere Grenzfrequenz des übertragenden
TK-Systems ist.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass
fug ≦ 500 Hz, vorzugsweise fug ≦ 330 Hz und fug ≧ 10 Hz.
4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch
gekennzeichnet, dass als Initialisierungswert n0 der maximal
darstellbare Wert des Zielsystems für die Signalübertragung
innerhalb des TK-Systems gewählt wird.
5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch
gekennzeichnet, dass für die Bestimmung des Schätzwerts n(x) der
Wert n1(x) auf einen vorgebbaren oder festen unteren Grenzwert
nmin gesetzt wird, falls ein Wert n1(x) < nmin ermittelt wird.
6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch
gekennzeichnet, dass für die Bestimmung des Schätzwerts n(x) der
Wert n1(x) auf einen vorgebbaren oder festen oberen Grenzwert
nmax gesetzt wird, falls ein Wert n1(x) < nmax ermittelt wird.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass der
obere Grenzwert nmax kleiner oder gleich dem Initialisierungswert n0
gewählt wird, vorzugsweise nmax ≦ n0 - 16 dB.
8. Verfahren nach einem der vorhergehenden Ansprüche, dadurch
gekennzeichnet, dass die innerhalb der Kurzzeitintervalle
gefundenen Maximumwerte des Eingangssignals x(k) mit einem
Skalierungsfaktor S < 1 multipliziert in die Ermittlung des Werts
n1(x) eingehen.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass der
Skalierungsfaktor S ≈ 0,5 gewählt wird.
10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch
gekennzeichnet, dass der Schätzwert n(x) als Maß für einen aktuell
abgeschätzten Geräuschpegel mit einem Faktor D < 1 skaliert wird.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass der
Faktor anwendungsabhängig gewählt wird innerhalb der Grenzen
2 ≦ D ≦ 5, vorzugsweise 3 ≦ D ≦ 4.
12. Verfahren nach einem der vorhergehenden Ansprüche, dadurch
gekennzeichnet, dass ein fester Schwellwert ε = const. eingestellt
wird, vorzugsweise ε ≈ 12 dB.
13. Verfahren nach einem der Ansprüche 1 bis 11, dadurch
gekennzeichnet, dass ein Schwellwert ε = ε(x) adaptiv mit der
Rauhigkeit des Pegels des Eingangssignals x(k) verändert wird.
14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass für den
adaptiv zu ermittelnden Schwellwert ε(x) ein Startwert ε0 = 12 dB
gewählt wird.
15. Servereinheit zur Unterstützung des Verfahrens nach einem der
Ansprüche 1 bis 14.
16. Prozessorbaugruppe, insbesondere digitaler Signalprozessor
(= DSP) zur Unterstützung des Verfahrens nach einem der
Ansprüche 1 bis 14.
17. Programmierbare Gate-Array-Baugruppe zur Unterstützung des
Verfahrens nach einem der Ansprüche 1 bis 14.
18. Computerprogramm zur Durchführung des Verfahrens nach einem
der Ansprüche 1 bis 14.
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10052626A DE10052626A1 (de) | 2000-10-24 | 2000-10-24 | Adaptiver Geräuschpegelschätzer |
EP01440295A EP1202253B1 (de) | 2000-10-24 | 2001-09-12 | Adaptiver Geräuschpegelschätzer |
AT01440295T ATE293828T1 (de) | 2000-10-24 | 2001-09-12 | Adaptiver geräuschpegelschätzer |
DE50105947T DE50105947D1 (de) | 2000-10-24 | 2001-09-12 | Adaptiver Geräuschpegelschätzer |
US09/973,828 US6842526B2 (en) | 2000-10-24 | 2001-10-11 | Adaptive noise level estimator |
JP2001320228A JP2002198918A (ja) | 2000-10-24 | 2001-10-18 | 適応雑音レベル推定器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10052626A DE10052626A1 (de) | 2000-10-24 | 2000-10-24 | Adaptiver Geräuschpegelschätzer |
Publications (1)
Publication Number | Publication Date |
---|---|
DE10052626A1 true DE10052626A1 (de) | 2002-05-02 |
Family
ID=7660840
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10052626A Withdrawn DE10052626A1 (de) | 2000-10-24 | 2000-10-24 | Adaptiver Geräuschpegelschätzer |
DE50105947T Expired - Fee Related DE50105947D1 (de) | 2000-10-24 | 2001-09-12 | Adaptiver Geräuschpegelschätzer |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE50105947T Expired - Fee Related DE50105947D1 (de) | 2000-10-24 | 2001-09-12 | Adaptiver Geräuschpegelschätzer |
Country Status (5)
Country | Link |
---|---|
US (1) | US6842526B2 (de) |
EP (1) | EP1202253B1 (de) |
JP (1) | JP2002198918A (de) |
AT (1) | ATE293828T1 (de) |
DE (2) | DE10052626A1 (de) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4490090B2 (ja) * | 2003-12-25 | 2010-06-23 | 株式会社エヌ・ティ・ティ・ドコモ | 有音無音判定装置および有音無音判定方法 |
JP4601970B2 (ja) * | 2004-01-28 | 2010-12-22 | 株式会社エヌ・ティ・ティ・ドコモ | 有音無音判定装置および有音無音判定方法 |
US20050226442A1 (en) * | 2004-04-12 | 2005-10-13 | Landon Michael D | Method and apparatus for achieving temporal volume control |
JP4551817B2 (ja) * | 2005-05-20 | 2010-09-29 | Okiセミコンダクタ株式会社 | ノイズレベル推定方法及びその装置 |
US8275153B2 (en) * | 2007-04-16 | 2012-09-25 | Evertz Microsystems Ltd. | System and method for generating an audio gain control signal |
US8894316B2 (en) * | 2009-07-22 | 2014-11-25 | Music Express, Llc | Adjustable joint for microphone |
US20130246060A1 (en) * | 2010-11-25 | 2013-09-19 | Nec Corporation | Signal processing device, signal processing method and signal processing program |
US10978096B2 (en) * | 2017-04-25 | 2021-04-13 | Qualcomm Incorporated | Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods |
US20220319532A1 (en) * | 2019-08-30 | 2022-10-06 | Dolby Laboratories Licensing Corporation | Pre-conditioning audio for machine perception |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3243232A1 (de) * | 1982-11-23 | 1984-05-24 | Philips Kommunikations Industrie AG, 8500 Nürnberg | Verfahren zur erkennung von sprachpausen |
DE68910859T2 (de) * | 1988-03-11 | 1994-12-08 | British Telecommunications P.L.C., London | Detektion für die Anwesenheit eines Sprachsignals. |
US5485522A (en) * | 1993-09-29 | 1996-01-16 | Ericsson Ge Mobile Communications, Inc. | System for adaptively reducing noise in speech signals |
DE69229627T2 (de) * | 1991-03-05 | 1999-12-02 | Picturetel Corp | Sprachkodierer mit veränderlicher bitrate |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3855423A (en) * | 1973-05-03 | 1974-12-17 | Bell Telephone Labor Inc | Noise spectrum equalizer |
US4000369A (en) * | 1974-12-05 | 1976-12-28 | Rockwell International Corporation | Analog signal channel equalization with signal-in-noise embodiment |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US5341456A (en) * | 1992-12-02 | 1994-08-23 | Qualcomm Incorporated | Method for determining speech encoding rate in a variable rate vocoder |
-
2000
- 2000-10-24 DE DE10052626A patent/DE10052626A1/de not_active Withdrawn
-
2001
- 2001-09-12 AT AT01440295T patent/ATE293828T1/de not_active IP Right Cessation
- 2001-09-12 EP EP01440295A patent/EP1202253B1/de not_active Expired - Lifetime
- 2001-09-12 DE DE50105947T patent/DE50105947D1/de not_active Expired - Fee Related
- 2001-10-11 US US09/973,828 patent/US6842526B2/en not_active Expired - Fee Related
- 2001-10-18 JP JP2001320228A patent/JP2002198918A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3243232A1 (de) * | 1982-11-23 | 1984-05-24 | Philips Kommunikations Industrie AG, 8500 Nürnberg | Verfahren zur erkennung von sprachpausen |
DE68910859T2 (de) * | 1988-03-11 | 1994-12-08 | British Telecommunications P.L.C., London | Detektion für die Anwesenheit eines Sprachsignals. |
DE69229627T2 (de) * | 1991-03-05 | 1999-12-02 | Picturetel Corp | Sprachkodierer mit veränderlicher bitrate |
US5485522A (en) * | 1993-09-29 | 1996-01-16 | Ericsson Ge Mobile Communications, Inc. | System for adaptively reducing noise in speech signals |
Also Published As
Publication number | Publication date |
---|---|
EP1202253B1 (de) | 2005-04-20 |
US6842526B2 (en) | 2005-01-11 |
ATE293828T1 (de) | 2005-05-15 |
DE50105947D1 (de) | 2005-05-25 |
EP1202253A2 (de) | 2002-05-02 |
EP1202253A3 (de) | 2004-01-02 |
JP2002198918A (ja) | 2002-07-12 |
US20020064288A1 (en) | 2002-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1143416B1 (de) | Geräuschunterdrückung im Zeitbereich | |
DE69913262T2 (de) | Vorrichtung und verfahren zur anpassung der rauschschwelle zur sprachaktivitätsdetektion in einer nichtstationären geräuschumgebung | |
DE69535709T2 (de) | Verfahren und Vorrichtung zur Auswahl der Kodierrate bei einem Vokoder mit variabler Rate | |
DE60108401T2 (de) | System zur erhöhung der sprachqualität | |
DE60131639T2 (de) | Vorrichtungen und Verfahren zur Bestimmung von Leistungswerten für die Geräuschunterdrückung für ein Sprachkommunikationssystem | |
EP1005695B1 (de) | Verfahren und vorrichtung zum erfassen eines anschlags in einem zeitdiskreten audiosignal | |
DE60028779T2 (de) | Rückkopplungsanullierung mit niederfrequenzeingang | |
DE60032797T2 (de) | Geräuschunterdrückung | |
DE4430189A1 (de) | Verfahren zur adaptiven Echokompensation | |
EP1103956B1 (de) | Exponentielle Echo- und Geräuschabsenkung in Sprachpausen | |
EP0742664A2 (de) | Freisprechverfahren für ein mehrkanaliges Übertragungssystem | |
DE112011105908B4 (de) | Verfahren und Gerät zur adaptiven Regelung des Toneffekts | |
DE19939102C1 (de) | Verfahren und Anordnung zum Erkennen von Sprache | |
EP1202253B1 (de) | Adaptiver Geräuschpegelschätzer | |
EP3588498B1 (de) | Verfahren zur unterdrückung eines akustischen nachhalls in einem audiosignal | |
DE112018003662T5 (de) | Sprachsignalnivellierung | |
EP3197181A1 (de) | Verfahren zur reduktion der latenzzeit einer filterbank zur filterung eines audiosignals sowie verfahren zum latenzarmen betrieb eines hörsystems | |
EP1155561B1 (de) | Vorrichtung und verfahren zur geräuschunterdrückung in fernsprecheinrichtungen | |
DE602004006912T2 (de) | Verfahren zur Verarbeitung eines akustischen Signals und ein Hörgerät | |
EP0600164A1 (de) | Verfahren zum Verbessern der Übertragungseingenschaften einer elektroakustischen Anlage | |
DE10137348A1 (de) | Verfahren und Schaltungsanordnung zur Geräuschreduktion bei der Sprachübertragung in Kommunikationssystemen | |
EP1453355A1 (de) | Signalverarbeitung in einem Hörgerät | |
EP1382034A1 (de) | Verfahren zur bestimmung von intensitätskennwerten von hintergrundgeräuschen in sprachpausen von sprachsignalen | |
DE19854341A1 (de) | Verfahren und Schaltungsanordnung zur Sprachpegelmessung in einem Sprachsignalverarbeitungssystem | |
DE10030926A1 (de) | Störsignalabhängige adaptive Echounterdrückung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
8139 | Disposal/non-payment of the annual fee |