DE3856280T2 - Rauschunterdrückungssystem - Google Patents

Rauschunterdrückungssystem

Info

Publication number
DE3856280T2
DE3856280T2 DE3856280T DE3856280T DE3856280T2 DE 3856280 T2 DE3856280 T2 DE 3856280T2 DE 3856280 T DE3856280 T DE 3856280T DE 3856280 T DE3856280 T DE 3856280T DE 3856280 T2 DE3856280 T2 DE 3856280T2
Authority
DE
Germany
Prior art keywords
noise
channel
energy
gain
snr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE3856280T
Other languages
English (en)
Other versions
DE3856280D1 (de
Inventor
Joseph John Hoffman Estates Il 60195 Barlo
Ira Alan Hoffman Estates Il 60195 Gerson
Brett Louis Palatine Il 60067 Lindsley
Richard Joseph Palatine Il 60067 Vilmur
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Application granted granted Critical
Publication of DE3856280D1 publication Critical patent/DE3856280D1/de
Publication of DE3856280T2 publication Critical patent/DE3856280T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02085Periodic noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • G10L2025/937Signal energy in various frequency bands

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

    Querbezug zu in Bezug genommenen Anmeldungen
  • Diese Anmeldung nimmt Bezug auf das U. S. Patent Nr. 4,628,529, angemeldet vom gleichen Anmelder wie die vorliegende Anmeldung. Weiterhin enthält diese Anmeldung einen Gegenstand, der zum U. S. Patent Nr. 4,630,304 und zum U. S. Patent Nr. 4,630,305 verwandt ist, die ebenfalls vom gleichen Anmelder wie die vorliegende Anmeldung angemeldet sind.
  • Hintergrund der Erfindung 1. Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft im allgemeinen akustische Rauschunterdrückungssysteme. Die vorliegende Erfindung ist im besonderen darauf gerichtet, die Sprachqualität eines Rauschunterdrückungssystems, das die Rauschunterdrückungstechnik der spektralen Subtraktion verwendet, zu verbessern.
  • 2. Beschreibung des Standes der Technik
  • Akustische Rauschunterdrückung in einem Sprachkommunikationssystem dient im allgemeinen dem Zweck der Verbesserung der Gesamtqualität des gewünschten Tonsignals durch Filterung des Umgebungshintergrundrauschens vom gewünschten Sprachsignal. Dieser Sprachverbesserungsvorgang ist besonders in Umgebungen notwendig, die ungewöhnlich hohe Pegel von Umgebungshintergrundrauschen haben, wie ein Flugzeug, ein fahrendes Auto oder eine laute Fabrik.
  • Die Rauschunterdrückungstechnik, die in den zuvor erwähnten Patenten beschrieben wird, ist die Technik der spektralen Subtraktion oder der spektralen Verstärkungsmodifikation. Wenn dieses Verfahren benutzt wird, wird das Toneingangssignal durch eine Reihe von Bandpassfiltern in einzelne spektrale Bänder aufgeteilt und bestimmte spektrale Bänder werden entsprechend ihres Rauschenergieinhalts gedämpft. Ein Spektralsubtraktionsrauschunterdrückungsvorfilter Verwendet eine Abschätzung der Hintergrundrauschleistungsspektraldichte, um in jedem Kanal einen Signal-Rausch-Abstand (SNR) der Sprache zu erzeugen, der dann verwendet wird, um einen Verstärkungsfaktor für jeden einzelnen Kanal zu berechnen. Der Verstärkungsfaktor wird als ein Zeiger für eine Verweistabelle verwendet, um die Dämpfung für dieses spezielle spektrale Band zu bestimmen. Die Kanäle werden dann gedämpft und wiedervereinigt, um die rauschunterdrückte Ausgangssignalform zu erzeugen.
  • Bei spezialisierten Anwendungen, die Umgebungen mit relativ hohem Hintergrundrauschen einschließen, weisen die meisten Rauschunterdrückungstechniken wesentliche Leistungsbegrenzungen auf. Ein Beispiel für eine solche Anwendung ist die Möglichkeit eines Fahrzeug-Lautsprecher-Mikrofons für ein zellulares Mobilfunktelefonsystem, das für den Autofahrer die Freisprechfunktion gewährleistet. Das mobile Freisprechmikrofon befindet sich typischerweise in einem größeren Abstand vom Nutzer, beispielsweise wenn es überkopf an der Sonnenblende befestigt ist. Das weiter entfernte Mikrofon liefert unter den Bedingungen der Straßen- und Windgeräusche einen viel schwächeren Signal-Rausch-Abstand an den landseitigen Gesprächsteilnehmer. Obwohl die auf der Landseite empfangene Sprache normalerweise verständlich ist, kann die ständige Beaufschlagung mit solchen Hintergrundrauschpegeln oftmals die Ermüdung des Hörers vergrößern.
  • Obwohl die meisten Verfahren nach dem Stand der Technik unter normalen Hintergrundrauschbedingungen ausreichend gut arbeiten, wird die Leistungsfähigkeit von bekannten Techniken in solchen spezialisierten Anwendungen von ungewöhnlich hohem Hintergrundrauschen stark eingeschränkt. Typische Spektralsubtraktionsrauschunterdrückungssysteme können den Hintergrundrauschpegel über das Sprachfrequenzspektrum um ungefähr 10 dB reduzieren, ohne die Sprachqualität ernsthaft zu beeinträchtigen. Wenn jedoch Verfahren nach dem Stand der Technik in Umgebungen mit relativ hohem Hintergrundrauschen verwendet werden, die Rauschunterdrückungspegel von annähernd 20 dB erfordern, gibt es eine wesentliche Verschlechterung in den Qualitätscharakteristiken der Sprache. Weiterhin entwickelt sich in Umgebungen mit schnell veränderlichem hohem Rauschen im Ausgangssprachsignal ein starkes niederfrequentes Rauschtrillern, das dem Klang von entferntem "Düsenantriebsdröhnen" ähnelt. Dieses Rauschtrillern haftet einem Spektralsubtraktionsrauschunterdrückungssystem an, denn die einzelnen Kanalverstärkungsparameter werden ständig in Reaktion auf die sich verändernde Hintergrundrauschumgebung aktualisiert.
  • Das Problem des Hintergrundrauschtrillerns wurde durch die Verwendung der Verstärkungsglättung indirekt angesprochen aber nicht eliminiert. Zum Beispiel schlagen R. J. McAulay und M. L. Malpass in dem Artikel, betitelt "Speech Enhancement Using a soft-Decision Noise Suppression Filter", IEEE Trans. Acoust., Speech, Signal Procession, Band ASSP-28, Nr. 2 (April 1980), S. 137-145, die Verwendung der Verstärkungsglättung auf einer rahmenweisen Grundlage vor, um die Einführung von Unstetigkeiten in die Ausgangssignalform zu vermeiden. Weil die Einführung der Verstärkungsglättung verursachen kann, daß die Rauschunterdrückungsvorfilter zu träge sind, um auf einen Übergang der ansteigenden Flanke zu reagieren (was in Sprachverzerrung resultieren würde), wurde ein Wichtungsfaktor von 1 oder ¹/&sub2; ausgewählt, so daß der Vorfilter sofort auf eine Erhöhung der Verstärkung reagiert, während er danach tendiert, jede Verminderung der Verstärkung zu glätten.
  • Leider erzeugt wiederum eine übermäßige Verstärkungsglättung erhebliche nachteilige Auswirkungen auf die Sprachqualität, die Hauptwirkung ist die erkennbare Einführung eines Endechos oder einer "Rauschpumpe" bei gesprochenen Wörtern. Es gibt ebenfalls bei großen Beträgen der Verstärkungsglättung eine wesentliche Verminderung der Sprachamplitude.
  • Die Rauschtrillerauswirkung wurde durch die Technik der Glättung des Rauschunterdrückungsverstärkungsfaktors für jeden einzelnen Kanal auf einer abtastwertweisen Grundlage anstatt auf einer rahmenweisen Grundlage weiter verbessert. Die abtastwertweise Glättung sowie die Verwendung von unterschiedlichen Glättungskoeffizienten für jeden Kanal wird im U. S. Patent Nr. 4,630,305, betitelt "Atomatic Gain Selector for a Noise Suppression System" beschrieben. Jedoch erkennt keines der bekannten Verfahren nach dem Stand der Technik, daß die Hauptquelle der Kanalverstärkungsunstetigkeiten die inhärente Schwankung des Hintergrundrauschens in jedem Kanal von einem Rahmen zum nächsten ist. In bekannten Spektralsubtraktionssystemen würde selbst eine 2 dB SNR- Abweichung eine Verstärkungsveränderung von einigen 43 hervorrufen, die dann als ein belästigendes Hintergrundrauschtrillern hörbar wäre. Daher ist das Trillerproblem niemals effektiv gelöst worden.
  • Überdies verkompliziert das Schmalbandrauschen, das eine hohe Leistungsspektraldichte in nur einigen wenigen Kanälen hat, das Hintergrundrauschtrillerproblem weiter. Da diese wenigen Hochenergierauschkanäle nicht durch die Hintergrundrauschunterdrückung gedämpft werden würden, hat der resultierende Tonausgang eine Charakteristik des Typs "Laufendes Wasser". Schmalbandrauschbündel verschlechtern ebenfalls die Genauigkeit der Hintergrundrauschaktualisierungsentscheidung, die notwendig ist, um die Rauschunterdrückung in Umgebungen mit wechselndem Hintergrundrauschen durchzuführen.
  • Da die Verstärkungsfaktoren durch SNR-Abschätzungen ausgewählt werden, die durch die Sprachenergie in jedem Kanal (Signal) und die momentane Hintergrundrauschenergieabschätzung in jedem Kanal (Rauschen) bestimmt werden, basiert die Leistungsfähigkeit des gesamten Rauschunterdrückungssystems auf der Genauigkeit der Hintergrundrauschabschätzung. Die statistischen Daten des Hintergrundrauschens werden während der Zeitdauer abgeschätzt, wenn nur das Hintergrundrauschen vorhanden ist, wie während der Unterbrechung in der menschlichen Sprache. Deshalb muß eine genaue Sprache/- Rauschunterscheidung getroffen werden, um zu bestimmen, wann solche Unterbrechungen in der Sprache auftreten.
  • Es ist weithin bekannt, daß die Energiehistogrammtechnik für die Unterscheidung zwischen Hintergrundrauschen und Sprache in Umgebungen mit normalen Umgebungsrauschen ausreichend gut arbeitet. Siehe zum Beispiel W. J. Hess, "A Pitch Synchronous Digital Feature Extraction system for Phonemic Recognition of Speech", IEEE Trans. Acoust., Speech, Signal Processing, Band ASSP-24, Nr. 1 (Februar 1976), S. 14-25. Energiehistogramme von akustischen Signalen stellen eine doppelmodulare Verteilung dar, bei der die beiden Modi dem Rauschen und der Sprache entsprechen. Auf diese Weise kann ein geeigneter Schwellenwert zwischen den beiden Modi eingestellt werden, um die Sprache/Rausch-Klassifizierung zu gewährleisten. Jedoch ist die Unterscheidung zwischen Hintergrundrauschenergie und stimmloser Sprachenergie in Umgebungen mit relativ hohem Hintergrundrauschen unklar. Demzufolge ist die Aufgabe, die beiden Modi des Energiehistogramms genau zu finden und den richtigen Schwellenwert zwischen ihnen einzustellen, extrem schwierig.
  • Um sich verändernde Rauschhintergründe anzupassen, realisieren McAulay und Malpass einen adaptiven Schwellenwert durch ständige Überwachung der Histogrammenergie auf einer rahmenweisen Basis und Aktualisierung des Schwellenwerts, indem unterschiedliche Verzögerungsfaktoren verwendet werden. Alternativ verwendet das U. S. Patent Nr. 4,630,304 einen Energietalwertdetektor, um auf der nachverarbeiteten Signalenergie - der Signalenergie, die am Ausgang des Rauschunterdrückungssystems verfügbar ist - basierend die Sprach/Rauschentscheidung durchzuführen, um das erkannte Sprachminimum zu bestimmen. Auf diese Weise wird die Genauigkeit der Hintergrundrauschabschätzung verbessert, da es auf einem viel saubereren Sprachsignal basiert.
  • Jedoch reagiert kein Verfahren nach dem Stand der Technik in geeigneter Weise auf ein plötzliches, starkes Ansteigen des Hintergrundrauschpegels. Diese Aktualisierungsentscheidungsvorgänge der Hintergrundrauschabschätzung interpretieren einen plötzlichen lauten Rauschpegelanstieg als Sprache, so daß keine Aktualisierungen durchgeführt werden. Das Energiehistogramm oder der Talwertdetektor haben eine langsame Anpassungscharakteristik, die sich schließlich an den höheren Rauschpegel anpassen wird. Diese Anpassungscharakteristik jedoch führt zu falschen Rauschaktualisierungen bei den schwächeren Energieabschnitten der Sprache. Diese fehlerhafte Entscheidung verschlechtert die Leistungsfähigkeit des Rauschunterdrückungssystems wesentlich.
  • Es besteht deshalb ein Bedarf nach einem verbesserten akustischen Rauschunterdrückungssystem, das auf die Probleme der Hintergrundrauschschwankungen, Schmalbandrauschbündel und plötzlichen Hintergrundrauschen gerichtet ist.
  • Zusammenfassung der Erfindung
  • In Übereinstimmung mit einem ersten Aspekt der vorliegenden Erfindung wird ein Rauschunterdrückungssystem zur Dämpfung des Hintergrundrauschens in einem verrauschten Eingangssignal bereitgestellt, um ein Rauschunterdrücktes Ausgangssignal zu erzeugen, wobei dieses Rauschunterdrückungssystem umfaßt: Mittel zur Aufteilung des Eingangssignals in eine Vielzahl von vorverarbeiteten Signalen, die durch ausgewählte Frequenzkanäle dargestellt werden; Mittel zur Erzeugung von Abschätzungen der Signal-plus-Rausch-Energie und der Rauschenergie in jedem einzelnen Kanal; und Mittel zur Erzeugung eines Verstärkungswerts für jeden einzelnen Kanal in Reaktion auf diese Kanalenergieabschätzungen; wobei das System dadurch gekennzeichnet ist, daß: diese Verstärkungswerte einen minimalen Verstärkungswert für jeden Kanal haben; diese Mittel zur Erzeugung eines Verstärkungswerts Schwellenwertmittel enthalten, um zu gestatten, daß Verstärkungswerte über diesem minimalen Verstärkungswert nur erzeugt werden, wenn diese Signal-plus- Rausch-Energieabschätzungen diese Rauschenergieabschätzungen um einen vorbestimmten Betrag überschreiten; und Mittel zur Modifizierung der Verstärkung jedes aus dieser Vielzahl vorverarbeiteter Signale in Reaktion auf diese Verstärkungswerte, um eine Vielzahl von nachverarbeiteten Signalen bereitzustellen.
  • In einem weiteren Aspekt der vorliegenden Erfindung wird ein Verfahren der Dämpfung des Hintergrundrauschens in einem verrauschten Eingangssignal bereitgestellt, um in einem Rauschunterdrückungssystem ein rauschunterdrücktes Ausgangssignal zu erzeugen, wobei das Verfahren die folgenden Schritte umfaßt: Aufteilung des Eingangssignals in eine Vielzahl von vorverarbeiteten Signalen, die durch eine Anzahl von N ausgewählten Frequenzkanälen dargestellt werden;
  • Erzeugung einer Abschätzung der Energie in jedem einzelnen Kanal; Erzeugung und Speicherung einer Abschätzung der Hintergrundrauschleistungsspektraldichte dieser vorverarbeiteten Signale; und Erzeugung einer Abschätzung des Signal- Rausch-Abstands (SNR) in jedem einzelnen Kanal auf der Grundlage dieser Hintergrundrauschabschätzungen und dieser Kanalenergieabschätzungen; wobei das Verfahren durch die folgenden Schritte gekennzeichnet ist: Erzeugung eines Verstärkungswerts für jeden einzelnen Kanal in Reaktion auf diese Kanal-SNR-Abschätzungen, wobei diese Verstärkungswerte einen Bereich von Minimalwerten haben; und wobei dieser die Verstärkungswerte erzeugende Schritt die folgenden Schritte beinhaltet: Bereitstellung eines vordefinierten SNR- Schwellenwerts und Vergleich dieser Kanal-SNR-Abschätzungen mit diesem vordefinierten SNR-Schwellenwert, so daß die Kanäle, die SNR-Abschätzungen unter diesem SNR-Schwellenwert haben, Verstärkungswerte innerhalb dieses Minimalbereichs erzeugen; und Modifizierung der Verstärkung jedes aus der Vielzahl vorverarbeiteter Signale in Reaktion auf diese Verstärkungswerte, um eine Vielzahl nachverarbeiteter Signale bereitzustellen.
  • Die vorliegende Erfindung stellt vorteilhafterweise ein Verfahren und Gerät zur Unterdrückung von Hintergrundrauschen in Umgebungen mit hohem Hintergrundrauschen dar, ohne die Sprachqualität wesentlich zu verschlechtern. Überdies richtet sich die vorliegende Erfindung auf das Problem der Hintergrundrauschschwankung, ohne große Beträge der Verstärkungsglättung zu erfordern. Außerdem stellt eine bevorzugte Ausführung der vorliegenden Erfindung ein Spektralsubtraktionsrauschunterdrückungssystem bereit, das die nachteiligen Auswirkungen von Schmalbandrauschbündeln ausgleicht. Weiterhin stellt die vorliegende Erfindung einen verbesserten Hintergrundrauschabschätzungsmechanismus bereit, der nicht durch schwachenergetische Sprachanteile getäuscht wird, und der außerdem noch eine Korrektur für plötzliche, starke Anstiege der Hintergrundrauschpegel gewährleistet.
  • In der vorliegenden Erfindung betreffen die Verbesserungen des Rauschunterdrückungssystems die Hinzufügung eines SNR- Schwellenwertmechanismus, um untergeordnete Verstärkungsschwankungen bei niedrigen SNR-Zuständen zu eliminieren, eine metrische Sprachmaßberechnungseinrichtung zur Erzeugung einer genaueren Aktualisierungsentscheidung der Hintergrundrauschabschätzung und eine Kanal-SNR-Modifizierungseinrichtung, um Schmalbandrauschbündel zu unterdrücken.
  • Der erste Aspekt der vorliegenden Erfindung bezieht sich im besonderen auf die Hinzufügung eines SNR-Schwellenwertmechanismus zur Bereitstellung eines vorbestimmten SNR-Schwellenwerts, den die Kanal-SNR-Abschätzungen überschreiten müssen, bevor ein Verstärkungswert oberhalb eines vordefinierten minimalen Verstärkungswerts erzeugt werden kann. In einer bevorzugten Ausführung ist der SNR-Schwellenwert auf 2,25 dB SNR eingestellt, so daß untergeordnete Hintergrundrauschschwankungen keine schrittweisen Unstetigkeiten in den Rauschunterdrückungsverstärkungen erzeugen.
  • In einer bevorzugten Ausführung wird eine Sprachmaßberechnungseinrichtung verwendet, um die Sprach/Rausch-Klassifizierung für die Hintergrundrauschaktualisierungsentscheidung durchzuführen, indem ein Zweischritt-Vorgang verwendet wird. Zuerst werden die ursprünglichen SNR-Abschätzungen benutzt, um eine Sprachmaßtabelle zu indexieren, um Sprachmaßwerte für jeden Kanal zu bekommen. Ein Sprachmaß ist eine Messung der gesamten sprachähnlichen Charakteristiken aller Kanalenergien. Die einzelnen Sprachkanalmeßwerte werden summiert, um einen ersten Mehrkanalenergieparameter zu erzeugen, und dann mit einem Hintergrundrauschaktualisierungsschwellenwert verglichen. Wenn die Sprachmaßsumme nicht den Schwellenwert erreicht, wird der Eingangsrahmen als Rauschen betrachtet und eine Hintergrundrauschaktualisierung wird durchgeführt. Zweitens wird die Zeitdauer seit dem Auftreten der vorherigen Hintergrundabschätzungsaktualisierung ständig überwacht. Wenn seit der letzten Aktualisierung zu viel Zeit vergangen ist, zum Beispiel 1 Sekunde, dann wird angenommen, daß ein wesentlicher Anstieg des Rauschens aufgetreten ist und eine Hintergrundrauschaktualisierung wird durchgeführt, trotzdem es so aussieht, als ob es sich um einem Sprachrahmen handelt. Diese zweite Prüfung gründet sich auf die Annahme, daß Sprache selten auf allen Kanälen für mehr als eine Sekunde ununterbrochen hohe Energiepegel enthält, was bei einem plötzlichen, lauten Rauschpegelanstieg der Fall sein würde. Der Sprachmaßalgorithmus, der den Zweischritt-Entscheidungsvorgang enthält, stellt ein sehr genaues Signal für die Hintergrundrauschabschätzungsaktualisierung bereit.
  • In einer weiteren bevorzugten Ausführung liefert ein Kanal- SNR-Modifizierungsmechanismus einen zweiten Mehrkanalenergieparameter in Reaktion auf die Anzahl der SNR-Abschätzungen der oberen Kanäle, die einen vorbestimmten Energieschwellenwert, zum Beispiel 6 dB SNR, überschreiten. Wenn nur wenige Kanäle einen Energiepegel oberhalb dieses Schwellenwerts haben (wie es für ein Schmalbandrauschbündel der Fall sein würde), würde der gemessene SNR für diese bestimmten Kanäle vermindert werden. Wenn außerdem die vorher erwähnte Sprachmaßsumme kleiner als ein Maßschwellenwert ist (was anzeigen würde, daß der Rahmen Rauschen wäre), werden alle Kanäle gleichermaßen vermindert. Diese SNR-Modifizierungstechnik gründet sich auf die Annahme, daß typische Sprache eine Mehrzahl von Kanälen aufweist, die Signal-Rausch-Abstände von 6 db und mehr haben.
  • Eine beispielhafte Ausführung der vorliegenden Erfindung wird nun unter Bezugnahme auf die begleitenden Zeichnungen beschrieben.
  • Kurze Beschreibung der Zeichnungen
  • Fig. 1 ist ein detailliertes Blockschaltbild, das eine bevorzugte Ausführung des verbesserten Rauschunterdrückungssystems in Übereinstimmung mit der vorliegenden Erfindung erläutert;
  • Fig. 2 ist eine grafische Darstellung, die die Ausgabe der Sprachmaßwerte als eine Funktion der Eingabe der SNR- Abschätzungsindexwerte für den Sprachmaßberechnungsblock von Fig. 1 darstellt;
  • Fig. 3 ist eine grafische Darstellung einer beispielhaften Verstärkungstabelle, die die Gesamtkanaldämpfung für bestimmte Kanalgruppen als eine Funktion der SNR-Abschätzung erläutert;
  • Fig. 4a bis 4f sind Ablaufdiagramme, die den speziellen Ablauf erläutern, der in Übereinstimmung mit der Verwendung der bevorzugten Ausführung der vorliegenden Erfindung durchgeführt wird;
  • Fig. 5a und 5b sind Ablaufdiagramme, die den allgemeinen Ablauf erläutern, der nach dem Stand der Technik durchgeführt wird;
  • Fig. 6a bis 6d sind detaillierte Ablaufdiagramme, die spezielle, in den Figur en 5a und 5b gezeigte Abläufe erläutern.
  • Detaillierte Beschreibung der bevorzugten Ausführung
  • Fig. 1 ist ein detailliertes Blockschaltbild der bevorzugten Ausführung der vorliegenden Erfindung. Alle Baugruppen der Fig. 1, die eine Bezugsnumerierung geringer als 600 haben, entsprechen jenen des U. S. Patents Nr. 4,628,529-Borth u. a. und werden in den Figur en 5a und 5b und in den Figur en 6a bis 6d der vorliegenden Anmeldung gezeigt. Die zusätzlichen Schaltungskomponenten, die Bezugsnumerierungen größer als 600 haben, stellen die Verbesserungen des Systems dar und werden nachfolgend hierin beschrieben.
  • Erstens, bezüglich dem Borth Patent U. S. 4,628,529 nach dem Stand der Technik (und nun ausdrücklich in Bezug auf die Figur en 5a und 5b und die Figur en 6a bis 6d), ist Fig. 5a/b ein Ablaufdiagramm, das die Gesamtfunktion des Rauschunterdrückungsmechanismus nach dem Stand der Technik erläutert. Dieses verallgemeinerte Ablaufdiagramm ist in drei Funktionsblöcke unterteilt: Rauschunterdrückungsschleife 604 - weiter detailliert in Fig. 6a beschrieben; automatischer Verstärkungswähler 615 - genauer in Fig. 6b beschrieben; und automatischer Hintergrundrauschabschätzer 621 - in den Figur en 6c und 6d erläutert.
  • Die Funktionsweise des verbesserten Rauschunterdrückungssystems beginnt in der Fig. 5a beim Initialisierungsblock 601. Wenn das System erstmals eingeschaltet wird, gibt es im Energieabschätzungsspeicherregister 585 keine alten Hintergrundrauschabschätzungen und es gibt im Energietalwertdetektor 570 keine Rauschenergievorgeschichte. Folglich wird während der Initialisierung 601 das Speicherregister 585 mit einem Initialisierungswert voreingestellt, der einen Hintergrundrauschabschätzungswert darstellt, der einem sauberen Sprachsignal am Eingang entspricht. Gleichfalls wird der Energietalwertdetektor 570 mit einem Initialisierungswert voreingestellt, der einen Talwertpegel darstellt, der einem verrauschten Sprachsignal am Eingang entspricht.
  • Der Initialisierungsblock 601 liefert ebenfalls anfängliche Abtastwertzählerstände, Kanalzählerstände und Rahmenzählerstände. Für die Zwecke der nachfolgenden Erläuterung wird eine Abtastperiode als 25 Millisekunden definiert, was einer Abtastrate von 8 kHz entspricht. Eine Rahmenperiode wird definiert, ein Zeitintervall von der Dauer 10 Millisekunden zu sein, auf das die Eingangssignalabtastwerte quantisiert werden. So entspricht ein Rahmen bei einer 8 kHz Abtastrate 80 Abtastwerten.
  • Anfangs wird der Abtastwertzähler auf Null gesetzt. Der Block 602 erhöht den Abtastwertzähler um Eins und im Block 603 wird ein verrauschter Sprachabtastwert vom A/D-Wandler 510 eingegeben. Der Sprachabtastwert wird dann im Block 605 durch das Frequenzanhebungsnetzwerk 520 frequenzmäßig angehoben. Der Frequenzanhebung folgend initialisiert der Block 606 den Kanalzähler auf Eins. Der Entscheidungsblock 607 prüft dann den Kanalzählerstand. Wenn der Kanalzähler kleiner als die höchste Kanalnummer N ist, wird der Abtastwert für diesen Kanal bandpassgefiltert und im Block 608 wird die Signalenergie für diesen Kanal abgeschätzt. Das Ergebnis wird für den späteren Gebrauch gespeichert. Der Block 609 glättet die ursprüngliche Kanalverstärkung für den vorhandenen Kanal, und der Block 610 modifiziert den Pegel des bandpassgefilterten Abtastwertes, indem die geglättete Kanalverstärkung verwendet wird. Die N Kanäle werden dann (ebenfalls im Block 610) kombiniert, um einen einzigen verarbeiteten Ausgangssprachabtastwert zu bilden. Der Block 611 erhöht den Kanalzähler um Eins und der Vorgang in den Blöcken 607 bis 611 wird wiederholt.
  • Wenn das Ergebnis der Entscheidung in 607 wahr ist, wird der kombinierte Abtastwert im Block 612 frequenzmäßig herabgesetzt und als ein modifizierter Sprachabtastwert im Block 613 ausgegeben. Der Abtastwertzähler wird dann im Block 614 geprüft um festzustellen, ob alle Abtastwerte im momentanen Rahmen verarbeitet worden sind. Wenn Abtastwerte übrigbleiben, wird die aus den Blöcken 602 bis 613 bestehende Schleife für einen weiteren Abtastwert wieder begonnen. Wenn alle Abtastwerte im momentanen Rahmen verarbeitet worden sind, leitet der Block 614 den Vorgang zur Aktualisierung der einzelnen Kanalverstärkungen im Block 615 ein.
  • In Fig. 5b fortfahrend setzt der Block 616 den Kanalzähler auf Eins. Der Block 617 prüft, ob alle Kanäle verarbeitet worden sind. Wenn diese Entscheidung negativ ist, berechnet Block 618 den Index zur Verstärkungstabelle für den bestimmten Kanal durch die Bildung einer SNR-Abschätzung. Dieser Index wird dann im Block 619 benutzt, um einen Kanalverstärkungswert von der Verweistabelle zu erhalten. Der Verstärkungswert wird dann für die Verwendung in der Rauschunterdrückungsschleife 604 gespeichert. Der Block 620 erhöht dann den Kanalzähler und Block 617 überprüft erneut um festzustellen, ob alle Kanalverstärkungen aktualisiert worden sind. Wenn diese Entscheidung bestätigt wird, wird dann im Block 621 die Hintergrundrauschabschätzung aktualisiert.
  • Um die Hintergrundrauschabschätzung zu aktualisieren, simuliert das Patent US-A-4,628,529 zuerst im Block 622 die nachverarbeitete Energie durch die Multiplikation des aktualisierten ursprünglichen Kanalverstärkungswerts mit der vorverarbeiteten Energieabschätzung für diesen Kanal. Als nächstes werden im Block 623 die simulierten nachverarbeiteten Energieabschätzungen kombiniert, um eine Gesamtkanalenergieabschätzung für die Verwendung durch den Energietalwertdetektor zu bilden. Der Block 624 vergleicht die Werte dieser nachverarbeiteten Gesamtenergieabschätzung mit dem vorherigen Talwertpegel. Wenn der Energiewert den vorherigen Talwertpegel überschreitet, wird im Block 626 der vorherige Talwertpegel durch die Erhöhung des Pegels mit einer langsamen Zeitkonstante aktualisiert. Dies tritt auf, wenn Sprache oder ein höherer Hintergrundrauschpegel vorhanden ist. Wenn der Ausgang des Entscheidungsblocks 624 negativ ist (nachverarbeitete Energie ist geringer als vorheriger Talwertpegel), wird der vorherige Talwertpegel im Block 625 durch Verminderung des Pegels mit einer schnellen Zeitkonstante aktualisiert. Diese Pegelverminderung des vorherigen Talwertpegels tritt auf, wenn minimales Hintergrundrauschen vorhanden ist. Dementsprechend wird der Hintergrundrauschverlauf ständig durch langsames Ansteigen oder schnelle Vermindern des vorherigen Talwertpegels in Richtung der momentanen nachverarbeiteten Energieabschätzung aktualisiert.
  • Nachfolgend auf die Aktualisierung des vorherigen Talwertpegels (Block 625 oder 626), prüft der Entscheidungsblock 627, ob der momentane nachverarbeitete Energiewert einen vorbestimmten Rauschschwellenwert überschreitet. Wenn das Ergebnis dieses Vergleichs negativ ist, wird eine Entscheidung getroffen, daß nur Rauschen vorhanden ist, und die Hintergrundrauschspektralabschätzung wird im Block 628 aktualisiert. Dies entspricht dem Schließen des Kanalschalters 575. Wenn das Ergebnis des Prüfung positiv ist, was anzeigt, daß Sprache vorhanden ist, wird die Hintergrundrauschabschätzung nicht aktualisiert. In jedem Fall endet die Funktion der Hintergrundrauschabschätzungseinrichtung 621, wenn der Abtastwertzähler im Block 629 zurückgesetzt wird und der Rahmenzähler im Block 630 erhöht wird. Die Funktion geht dann zum Block 602 über, um die Rauschunterdrückung auf dem nächsten Sprachrahmen zu beginnen.
  • Das Ablaufdiagramm der Fig. 6a erläutert die spezifischen Einzelheiten des Ablaufs der Rauschunterdrückungsschleife 604. Für jeden Abtastwert der Eingangssprache erhöht der Block 701 den Abtastwert mit Hilfe des Filters frequenzmäßig, was durch die Gleichung beschrieben wird:
  • Y(nT) = X(nT) - K&sub1;[X((n - 1)T)]
  • wobei Y(nT) der Ausgang des Filters zum Zeitpunkt nT ist, T ist die Abtastwertperiode, X(nT) und X((n - 1)T) sind die Eingangsabtastwerte zu den Zeitpunkten nT bzw. (n - 1)T und der Frequenzerhöhungskoeffizient K&sub1; ist 0,9375. Wie vorher angemerkt, erhöht dieser Filter den Sprachabtastwert frequenzmäßig auf ungefähr +6 dB pro Oktave.
  • Block 702 setzt den Kanalzähler auf Eins und initialisiert die Ausgangsabtastwertsumme auf Null. Block 703 prüft um festzustellen, ob der Kanalzähler gleich der Gesamtanzahl der Kanäle N ist. Wenn diese Entscheidung negativ ist, beginnt die Rauschunterdrückungsschleife mit der Filterung des Sprachabtastwerts durch den Bandpassfilter entsprechend dem vorhandenen Kanalzählerstand. Wie früher angemerkt, sind die Bandpassfilter digital realisiert, indem DSP-Techniken verwendet werden, so daß sie als 4-poliger Butterworth Bandpassfilter wirken.
  • Der Sprachabtastwertausgang vom Bandpassfilter (cc) wird dann im Block 705 doppelweg-gleichgerichtet und im Block 706 tiefpassgefiltert, um den Energiehüllkurvenwert E(cc) für diesen bestimmten Abtastwert zu erhalten. Diese Kanalenergieabschätzung wird dann im Block 707 für die spätere Verwendung gespeichert. Wie es für Fachmänner erkennbar sein wird, ist der Energiehüllkurvenwert E(cc) faktisch eine Abschätzung der Quadratwurzel der Energie in diesem Kanal.
  • Block 708 liefert den ursprünglichen Verstärkungswert RG für den Kanal cc und führt die Verstärkungsglättung mit Hilfe eines IIR-Filters erster Näherung durch, indem die Gleichung realisiert wird:
  • G(nT) = G((n - 1)T) + K&sub2;(cc) (RG(nT) - G(n - 1)T)
  • wobei G(nT) die geglättete Kanalverstärkung zum Zeitpunkt nT ist, T ist die Abtastperiode, G((n - 1)T) ist die geglättete Kanalverstärkung zum Zeitpunkt (n - 1)T, RG(nT) ist die berechnete ursprüngliche Kanalverstärkung für die letzte Rahmenperiode und K&sub2;(cc) ist der Filterkoeffizient für den Kanal cc. Diese Glättung der ursprünglichen Verstärkungswerte auf einer abtastwertweisen Grundlage reduziert die Unstetigkeiten in den Verstärkungsveränderungen, wodurch die Rauschtrillerleistung wesentlich verbessert wird.
  • Block 709 multipliziert den in Block 704 erhaltenen gefilterten Abtastwert mit dem geglätteten Verstärkungswert für den Kanal cc, der vom Block 708 erhalten wird. Diese Funktion modifiziert den Pegel des bandpassgefilterten Abtastwerts, indem die momentane Kanalverstärkung verwendet wird, entsprechend der Funktion der Kanalverstärkungsmodifizierungseinrichtung 250. Block 710 addiert dann den modifizierten Filterabtastwert für den Kanal cc zu der Ausgangsabtastwertgesamtsumme, was die N modifizierten Bandpassfilterausgänge kombiniert, wenn es N-mal durchgeführt wird, um einen einzigen verarbeiteten Sprachabtastwertausgang zu bilden. Die Funktion des Blocks 710 entspricht dem Kanalkombinierer 260. Block 711 erhöht den Kanalzähler um Eins und der Ablauf der Blöcke 703 bis 711 wird dann wiederholt.
  • Wenn das Ergebnis der Prüfung in 703 wahr ist, wird im Block 712 der Ausgangssprachabtastwert auf ungefähr -6 dB pro Oktave frequenzmäßig herabgesetzt entsprechend der Gleichung:
  • Y(nT) = X(nT) + K&sub3;[Y((n - 1)T]
  • wobei X(nT) der verarbeitete Abtastwert zum Zeitpunkt §17 ist, T ist die Abtastperiode, Y(nT) und Y((n - 1)T sind die frequenzmäßig herabgesetzten Sprachabtastwerte zu den Zeitpunkten nT bzw. (n - 1)T und K&sub3; ist der Frequenzherabsetzungskoeffizient, der einen Wert von 0,9375 hat. Der frequenzmäßig herabgesetzte verarbeitete Sprachabtastwert wird dann zum D/A-Wandlerblock 613 ausgegeben. Auf diese Weise erläutert die Rauschunterdrückungschleife der Fig. 6a sowohl die Kanalfilterreihenrauschunterdrückungstechnik als auch die abtastwertweise Kanalverstärkungsglättungstechnik.
  • Das Ablaufdiagramm der Fig. 6b beschreibt noch genauer die detaillierte Funktion des automatischen Verstärkungsauswahlblocks 614 der Fig. 5. Der Verarbeitung aller Sprachabtastwerte in einem bestimmten Rahmen folgend, geht die Funktion zum Block 615 über, der dazu dient, die einzelnen Kanalverstärkungen zu aktualisieren. Zuerst wird im Block 720 der Kanalzähler (cc) auf Eins gesetzt. Als nächstes prüft der Entscheidungsblock 721, ob alle Kanäle verarbeitet worden sind. Wenn nicht, setzt sich die Funktion mit Block 722 fort, der den Signal-Rausch-Abstand für den bestimmten Kanal berechnet. Wie früher erwähnt, ist die SNR-Berechnung einfach eine Division der kanalweisen Energieabschätzungen (Signalplus-Rauschen) durch die kanalweisen Hintergrundrauschabschätzungen (Rauschen). Deshalb dividiert der Block 722 einfach die momentan gespeicherte Kanalenergieabschätzung vom Block 707 durch die momentane Hintergrundrauschabschätzung vom Block 628 nach der Gleichung
  • Index(cc) = [momentane Rahmenenergie für Kanal cc] / [Hintergrundrauschenergieabschätzung für Kanal cc]
  • Im Block 723 wird die bestimmte Verstärkungstabelle, die indexiert werden soll, ausgewählt. Der quantifizierte Wert des momentanen Talwertpegels wird verwendet, um diese Auswahl durchzuführen. Es kann jedoch jedes Verfahren zur Verstärkungstabellenauswahl verwendet werden. Weiterhin ist für Rauschunterdrückungssysteme, die eine einzige Verstärkungstabelle verwenden, keine Verstärkungstabellenauswahl notwendig.
  • Der in Block 722 berechnete SNR-Index wird im Block 724 verwendet, um den ursprünglichen Kanalverstärkungswert aus der geeigneten Verstärkungstabelle aufzurufen. Daher wird der Verstärkungswert als eine Funktion von zwei oder drei Variablen indexiert: (1) der Kanalnummer; (2) der momentanen Kanal-SNR-Abschätzung; und möglicherweise (3) des gesamtdurchschnittlichen Hintergrundrauschpegels.
  • Block 725 speichert den durch den Block 724 ausgewählten ursprünglichen Verstärkungswert. Im Block 726 wird der Kanalzähler erhöht und der Entscheidungsblock 721 wird wieder begonnen. Nachdem alle N Kanalverstärkungen aktualisiert worden sind, geht der Ablauf zum Block 621 über. Daher aktualisiert der automatische Verstärkungsauswahlblock 615 die Kanalverstärkungswerte auf einer rahmenweisen Grundlage, um den momentanen SNR jeden einzelnen Kanals noch genauer wiederzugeben.
  • Fig. 6c und Fig. 6d erweitern den Block 621, um die Wirkungsweise einer automatischen Hintergrundrauschabschätzungseinrichtung nach dem Stand der Technik noch spezifischer zu beschreiben. Im einzelnen beschreibt Fig. 6c den Vorgang der Simulation der nachverarbeiteten Energie und die Kombinierung dieser Abschätzungen, während Fig. 6d die Funktion des Talwertdetektors 570 beschreibt.
  • Nun Bezug auf Fig. 6c nehmend, die Funktion zur Simulation der nachverarbeiteten Sprache beginnt im Block 730 durch das Setzen des Kanalzählers (cc) auf Eins. Block 731 prüft diesen Kanalzähler um festzustellen, ob alle N Kanäle verarbeitet worden sind. Wenn nicht, beschreibt die Gleichung des Blocks 732 den tatsächlichen Simulationsvorgang, der durch eine Energieabschätzungsmodifizierungseinrichtung nach dem Stand der Technik durchgeführt wird.
  • Die simulierte nachverarbeitete Sprachenergie wird durch die Multiplikation des ursprünglichen Kanalverstärkungswerts (direkt von den Kanalverstärkungstabellen erhalten) mit der vorverarbeiteten Energieabschätzung (von der Kanalenergieabschätzungseinrichtung 220 erhalten) für jeden Kanal über die Gleichung erzeugt:
  • SE(cc) = E(cc)RG(cc)
  • wobei SE(cc) die simulierte nachverarbeitete Energie für den Kanal cc ist, E(cc) ist die momentane Rahmenenergieabschätzung für den Kanal cc, die durch den Block 707 gespeichert wird, und RG(cc) ist der ursprüngliche Kanalverstärkungswert für den Kanal cc, der vom Block 725 erhalten wird. Wie früher angemerkt, ist E(cc) faktisch die Quadratwurzel der Energie im Kanal, da es eine Messung der Signalhüllkurve ist. Deswegen wird der RG(cc) Term in der obigen Gleichung nicht quadriert. Die Multiplikation, die im Block 732 durchgeführt wird, dient im wesentlichen der gleichen Funktion wie die Kanalverstärkungsmodifizierungseinrichtung 250, mit der Ausnahme, daß die Kanalverstärkungsmodifizierungseinrichtung das vorverarbeitete Sprachsignal verwendet, wohingegen die Energieabschätzungsmodifizierungseinrichtung 560 die vorverarbeitete Sprachenergie verwendet.
  • Der Kanalzähler wird dann im Block 733 erhöht und im Block 731 neu geprüft. Wenn für alle N Kanäle ein simulierter vorverarbeiteter Energiewert erhalten wurde, dienen die Blöcke 734 bis 738 dazu, die einzelnen simulierten Kanalenergieabschätzungen zu kombinieren, um eine einzige Gesamtenergieabschätzung nach der Gleichung zu bilden:
  • KANAL(i)NACHVERARBEITETE ENERGIE
  • wobei N die Anzahl der Filter in der Filtergruppe ist. Block 734 initialisiert der Kanalzähler auf Eins und Block 735 initialisiert den nachverarbeiteten Gesamtenergiewert auf Null. Nach der Initialisierung prüft der Entscheidungblock 736, ob alle Kanalenergien kombiniert worden sind oder nicht. Wenn nicht, addiert der Block 737 den simulierten nachverarbeiteten Energiewert für den momentanen Kanal zu dem nachverarbeiteten Gesamtenergiewert. Die momentane Kanalnummer wird dann im Block 738 erhöht und die Kanalnummer wird wieder im Block 736 geprüft. Wenn alle N Kanäle kombiniert worden sind, um die simulierte nachverarbeitete Gesamtenergieabschätzung zu bilden, geht der Vorgang zum Block 740 der Fig. 6d über.
  • Nun Bezug auf Fig. 6d nehmend, die Blöcke 740 bis 745 erläutern, wie die nachverarbeitete Signalenergie verwendet wird, um den vorherigen Talwertpegel zu erzeugen und zu aktualisieren, entsprechend der Funktion eines Energietalwertdetektors nach dem Stand der Technik. Nachdem alle nachverarbeiteten Energien pro Kanal kombiniert worden sind, berechnet der Block 740 den Logarithmus dieser kombinierten nachverarbeiteten Kanalenergie. Ein Grund dafür, daß in der Ausführung die Logarithmusdarstellung der nachverarbeiteten Sprachenergie verwendet wird, besteht darin, die Darstellung eines Signals mit einem extrem großen dynamischen Bereich (> 90 dB) in einem 8-Bit-Mikroprozessorsystem zu erleichtern.
  • Der Entscheidungblock 741 prüft dann um festzustellen, ob dieser logarithmische Energiewert den vorherigen Talwertpegel überschreitet. Wie früher erwähnt, ist der vorherige Talwertpegel entweder der gespeicherte Talwertpegel für den vorherigen Rahmen oder ein initialisierter Talwertpegel, der durch den Block 601 der Fig. 6 bereitgestellt wird. Wenn der logarithmische Wert den vorherigen Talwertpegel überschreitet, wird der vorherige Talwertpegel im Block 743 mit dem momentanen logarithmischen [nachverarbeiteten Energie-] Wert durch die Erhöhung des Pegels mit der langsamen Zeitkonstante von ungefähr einer Sekunde aktualisiert, um einen momentanen Talwertpegel zu bilden. Dies tritt auf, wenn Sprache oder ein höherer Hintergrundrauschpegel vorhanden ist. Wenn umgekehrt der Ausgang des Entscheidungsblocks 741 negativ ist (log[nachverarbeitete Energie] kleiner als vorheriger Talwertpegel), wird der vorherige Talwertpegel im Block 742 mit dem momentanen log[nachverarbeitete Energie]-Wert durch Verminderung des Pegels mit einer schnellen Zeitkonstante von ungefähr 40 Millisekunden aktualisiert, um den momentanen Talwertpegel zu bilden. Dies tritt auf, wenn ein geringerer Hintergrundrauschpegel vorhanden ist. Dementsprechend wird der Hintergrundrauschverlauf durch langsames Anheben oder schnelles Absenken des vorherigen Talwertpegels in Abhängigkeit vom Hintergrundrauschpegel der momentan simulierten nachverarbeiteten Sprachenergleabschätzung ständig aktualisiert.
  • Nach der Aktualisierung des vorherigen Talwertpegels prüft der Entscheidungsblock 744, ob der momentane log[nachverarbeitete Energie]-Wert den momentanen Talwertpegel plus einen vorbestimmten Versatz überschreitet. Die Addition des momentanen Talwertpegels plus diesen Talwertversatz erzeugt einen Rauschschwellenwertpegel. Dieser Versatz gewährleistet ungefähr ein 6 dB Anwachsen des momentanen Tal wertpegels. Deswegen besteht ein weiterer Grund für die Benutzung der logarithmischen Arithmetik darin, den konstanten 6 dB Versatzadditionsvorgang zu vereinfachen.
  • Wenn der logarithmische Energiewert diesen Schwellenwert überschreitet - was einem Sprachrahmen eher entsprechen würde als Hintergrundrauschen - wird die momentane Hintergrundrauschabschätzung nicht aktualisiert und der Hintergrundrauschaktualisierungsvorgang endet. Wenn jedoch der logarithmische Energiewert den Rauschschwellenwertpegel nicht überschreitet - was einem erkannten Minimum im nachverarbeiteten Signal entsprechen würde, das anzeigt, daß nur Rauschen vorhanden ist - wird im Block 745 die Hintergrundrauschspektralabschätzung aktualisiert. Dies entspricht dem Schließen des Kanalschalters 757 in Reaktion auf ein positives Talwerterkennungssignal vom Energietalwertdetektor 570. Dieser Aktualisierungsvorgang besteht aus der Bereitstellung eines zeitlich gemittelten Werts der vorverarbeiteten Kanalenergieabschätzung für den bestimmten Kanal durch die Glättung der Abschätzung (im Glättungsfilter 580) und aus der Speicherung dieser zeitlich gemittelten Werte als die Rauschabschätzungen pro Kanal (im Energieabschätzungsspeicherregister 585). Diese Funktion des Hintergrundrauschabschätzungsblocks 621 endet für den bestimmten Rahmen, der verarbeitet wird, durch den Übergang zum Block 629 und 630, um einen neuen Rahmen zu erhalten.
  • Nun werden die Funktion und die Struktur der vorliegenden Erfindung detailliert beschrieben (wieder Bezug auf Fig. 1 nehmend), das verbesserte Rauschunterdrückungssystem 800 beinhaltet Veränderungen gegenüber dem vorher erwähnten Borth Rauschunterdrückungssystem auf drei grundlegenden Gebieten: (a) die Aktualisierung der Hintergrundrauschabschätzungen durch die Sprachmaßberechnungseinrichtung 810; (b) die Modifikation der SNR-Abschätzungen durch die Kanal-SNR- Modifizierungseinrichtung 820; und (c) die Verwendung des SNR-Schwellenwertblocks 830, um den Verstärkungsanstieg jedes Kanals zu verschieben. Jede dieser Verbesserungen wird in Bezug auf das Blockschaltbild der Fig. 1 und in Bezug auf das Ablaufdiagramm der Fig. 4a-4f beschrieben.
  • Die Sprachmaßberechnungseinrichtung 810 ersetzt die Talwertdetektorschaltung des bisherigen Systems. Ein Sprachmaß ist im wesentlichen eine Messung der gesamten sprachähnlichen Charakteristiken aller Kanalenergien. In der bevorzugten Ausführung wird die Sprachmaßberechnungseinrichtung 810 als eine Verweistabelle realisiert, die die einzelnen Kanal-SNR-Abschätzungen auf 235 in Sprachmaßwerte übersetzt. Die Sprachmaßwerte werden intern verwendet um zu bestimmen, wann die Hintergrundrauschabschätzungen durch Schließen des Kanalschalter 575 für einen Rahmen zu aktualisieren sind. Wie hierin verwendet, ist die Aktualisierung der Hintergrundrauschabschätzung als die teilweise Modifizierung der alten Hintergrundrauschabschätzung durch eine neue Abschätzung definiert, indem zum Beispiel ein neu/alt Abschätzungsverhältnis von 10%/90% verwendet wird. Die Sprachmaßwerte werden ebenfalls im Kanal-SNR-Modifizierungsvorgang verwendet, wie er nachfolgend beschrieben wird.
  • Aus der Sicht der Durchführung einer Hintergrundrauschaktualisierungsentscheidung könnte ein Rahmen, der hohe Energie hat, was typischerweise eine Anzeige eines Sprachrahmens ist, ebenfalls bedeuten, daß ein Schmalbandrauschtransient oder ein plötzlicher Anstieg des Hintergrundrauschpegels aufgetreten ist. Deswegen kennzeichnet die vorliegende Erfindung die Rahmenenergie als eine Sprachmaßsumme VMSUM und verwendet diesen Mehrkanalenergieparameter, um die Aktualisierungsentscheidung durchzuführen. Der Vorgang verwendet eine Sprachmaßtabelle, die als eine Kurve, wie in Fig. 2 gezeigt, dargestellt werden kann.
  • Fig. 2 ist eine grafische Darstellung, die die charakteristische Kurve der Sprachmaße für einen bestimmten Kanal erläutert. Die waagerechte Achse stellt die SNR-Abschätzungsindizes dar. Jeder SNR-Abschätzungsindexwert bedeutet drei Achtel (3/8) dB Signal-Rausch-Abstand. So stellt ein SNR-Index von 10 ein SNR von 3,75 dB dar. Die senkrechte Achse stellt die Sprachmaßwerte VM(cc) für jeden der N Kanäle dar. Es ist zu beachten, daß für einen SNR-Index von 1 ein Sprachmaß von 2 erzeugt wird. Es ist auch anzumerken, daß die Kurve nicht linear ist, weil die Kanalenergie bei höheren SNRs mehr sprachähnliche Charakteristiken hat.
  • Erstens werden die ursprünglichen SNR-Abschätzungen verwendet, um die Sprachmaßtabelle zu indexieren, um einen Sprachmaßwert VM(CC) für jeden Kanal zu erhalten. Zweitens werden die einzelnen Kanalsprachmaßwerte summiert, um die Summe von allen einzelnen Kanalsprachmaßwerten zu erzeugen, die die Sprachmaßsumme VMSUM genannt wird. Drittens wird VMSUM mit einem AKTUALISIERUNGSSCHWELLENWERT verglichen, der eine Sprachmaßsumme darstellt, die als Rauschen betrachtet wird. Wenn der Mehrkanalenergieparameter VMSUM kleiner als der AKTUALISIERUNGSSCHWELLENWERT ist, hat der betreffende Rahmen sehr wenig sprachähnliche Charakteristiken und ist höchstwahrscheinlich Rauschen. Deswegen wird eine Hintergrundrauschaktualisierung durch das Schließen des Kanalschalters 575 für den betreffenden Rahmen durchgeführt. Die allerneueste Sprachmaßsumme VMSUM wird ebenfalls für die Kanal-SNR-Modifizierungseinrichtung 820 über die Leitung 815 zur Verwendung im Modifikationsalgorithmus verfügbar gemacht. In der bevorzugten Ausführung wird der AKTUALISIERUNGSSCHWELLENWERT auf einen Gesamtsprachmaßsummenwert von 32 gesetzt. Da der minimale Wert in der Sprachmaßtabelle 2 ist, ist die minimale Summe für 14 Kanäle 28. Die Sprachmaßtabellenwerte bleiben auf 2, bis ein SNR-Index von 12 (oder 4,5 dB SNR) erreicht wird. Das bedeutet, daß ein erhöhter Pegel des Breitbandrauschens (die einzelnen Kanäle haben jeweils SNR-Werte, die nicht größer als 4,125 dB sind) noch einen Summe von 28 erzeugen wird. Da der AKTUALISIERUNGSSCHWELLENWERT von 32 nicht überschritten werden würde, würde das Breitbandrauschsprachmaß korrekterweise als Rauschen klassifiziert werden und-es würde eine Hintergrundrauschaktualisierung durchgeführt werden. Umgekehrt würde jeder einzelne Kanal, der einen SNR-Indexwert größer als 24 (oder zumindest 9,0 dB SNR) hat, verursachen, daß VMSUM den AKTUALISIERUNGSSCHWELLENWERT überschreitet und in einer Sprach- oder Schmalbandrauschbündelentscheidung resultieren.
  • Viele Variationen der Sprachmaßtabelle sind möglich, da verschiedene Maßtypen für die richtige Auswahl des AKTUALISIERUNGSSCHWELLENWERTS verglichen werden können. Weiterhin kann die Empfindlichkeit der Sprache/Rauschen- Entscheidung für eine bestimmte Anwendung ausgewählt werden. In der bevorzugten Ausführung zum Beispiel kann der Schwellenwert eingestellt werden, um jeden einzelnen Kanal zu berücksichtigen, der einen SNR-Wert hat, der so empfindlich wie 4,5 dB ist bis so unempfindlich wie 15 dB ist. Der entsprechende AKTUALISIERUNGSSCHWELLENWERT würde dann innerhalb des Bereichs von 29 bis 41 gesetzt.
  • Zusätzlich zur Durchführung der Sprache/Rauschen-Entscheidung durch die Verwendung der Sprachmaße verfolgt die Sprachmaßberechnungseinrichtung 810 die Zeitdauer, die seit der letzten Hintergrundrauschaktualisierung vergangen ist. Ein Aktualisierungszähler wird bei jedem Rahmen geprüft um festzustellen, ob mehr als eine vorgegebene Anzahl von Sprungmarken, die jede eine vorbestimmte Zeit darstellen, seit der vorherigen Aktualisierung passiert hat. In der be vorzugten Ausführung, die 10 Millisekundenrahmen verwendet, was einem zeitlichen Schwellenwert von 1 Sekunde ohne Aktualisierungen entspricht, wird eine Aktualisierung durchgeführt, wenn der Aktualisierungszähler 100 erreicht, ungeachtet der Sprachmaßentscheidung. Es wäre jedoch jeder zeitliche Schwellenwert innerhalb des Bereichs von 0,5 Sekunden bis 4 Sekunden realisierbar. Wie vorher erwähnt wird diese Zeitparameterprüfung verwendet, um zu verhindern, daß jedes plötzliche, starke Ansteigen des Rauschpegels undefiniert als Sprache interpretiert wird.
  • Die Grundfunktion der Kanal-SNR-Modifizierungseinrichtung 820 besteht darin, die nachteiligen Auswirkungen der Schmalbandrauschbündel auf das Rauschunterdrückungssystem zu eliminieren. Ein Schmalbandrauschbündel kann als eine zeitweilige Erhöhung der Kanalenergie für einige wenige Kanäle definiert werden. In der bevorzugten Ausführung wird ein hoher Energiepegel oberhalb eines 6 dB SNR-Schwellenwerts in weniger als 5 der oberen 10 Kanäle als ein Schmalbandrauschbündel klassifiziert. Ein solches Rauschbündel würde normalerweise hohe Verstärkungswerte für nur eine geringe Anzahl von Kanälen erzeugen, was in einem oben beschriebenen Hintergrundrauschtrillern vom Typ "Laufendes Wasser" resultieren würde.
  • Ursprüngliche SNR-Abschätzungen auf 235 werden an den Eingang der Kanal-SNR-Modifizierungseinrichtung 820 angelegt und modifizierte SNR-Abschätzungen sind am Ausgang auf 825. Grundsätzlich zählt die SNR-Modifizierungseinrichtung 820 die Zahl der Kanäle, die Kanal-SNR-Indexwerte haben, die einen Indexschwellenwert überschreiten. In der bevorzugten Ausführung wird der Indexschwellenwert gesetzt, um einem SNR-Wert innerhalb des Bereichs von 4 dB bis 10 dB, vorzugsweise 6 dB SNR, zu entsprechen. Wenn die Zahl der Kanäle unter einem vorbestimmten Zählerschwellenwert ist, dann wird die Entscheidung getroffen, die SNRs zu modifizieren. Der Zähler schwellenwert stellt eine relativ geringe Anzahl von Kanälen dar, d. h. nicht mehr als 40% der Gesamtanzahl der Kanäle N. In der bevorzugten Ausführung wird der Zählerschwellenwert auf 5 von den 10 gemessenen Kanälen gesetzt. Während des Modifikationsvorgangs selbst reduziert die Kanal-SNR- Modifizierungseinrichtung 820 entweder den SNR nur von den bestimmten Kanälen, die einen SNR-Index haben, der kleiner als ein RÜCKSETZSCHWELLENWERT (eine Anzeige eines Schmalbandrauschkanals) ist, oder reduziert den SNR von allen Kanälen, wenn die Sprachmaßsumme kleiner als ein Maßschwellenwert (eine Anzeige eines sehr schwachen Energierahmens) ist. So werden die Kanäle gedämpft, die das Schmalbandrauschbündel enthalten, um sie daran zu hindern, die Verstärkungstabellenverweisfunktion nachteilig zu beeinflussen.
  • Der SNR-Schwellenwertblock 830 prüft einen vorbestimmten SNR- Schwellenwert für jeden Kanal, der von den modifizierten Kanal-SNR-Abschätzungen überschritten werden muß, bevor ein hoher Verstärkungswert erzeugt werden kann. Nur SNR- Abschätzungen, die einen Wert oberhalb des SNR-Schwellenwerts haben, werden direkt an die Verstärkungstabellensätze angelegt. Deshalb wird es kleinen Hintergrundrauschschwankungen nicht gestattet, hohe Verstärkungswerte zu erzeugen, die Sprache darstellen. Diese Verwendung eines SNR-Schwellenwerts stellt im wesentlichen einen Versatz im Verstärkungsanstieg für Kanäle dar, die einen geringen Signal-Rausch-Abstand haben. Vorzugsweise würde der SNR-Schwellenwert innerhalb des Bereichs von 1,5 dB bis 5 dB gesetzt werden, um geringe Rauschschwankungen zu eliminieren. Der SNR-Schwellenwert kann als eine separate Baugruppe wie in Fig. 1 gezeigt realisiert werden, oder er kann als eine "tote Zone" in der charakteristischen Verstärkungskurve für jeden Verstärkungstabellensatz 590 realisiert sein.
  • Fig. 3 erläutert grafisch die Funktion des SNR-Schwellenwertblocks 830 sowie die Dämpfungsfunktion der Kanalverstärkungswerte in jedem Verstärkungstabellensatz. Auf der waagerechten Achse sind die modifizierten SNR-Abschätzungen in dB dargestellt, wie sie von der Kanal-SNR-Modifizierungseinrichtung 820 auf 825 ausgegeben werden würden. Die senkrechte Achse stellt die Kanalverstärkung (Dämpfung) dar, die am Ausgang des Kanalverstärkungsmodifizierungseinrichtung 250 auf 255 beobachtet werden würde. Ein maximaler Betrag der Hintergrundrauschdämpfung wird für Kanäle erreicht, die einen minimalen Verstärkungswert haben. Es ist anzumerken, daß der SNR-Schwellenwertblock 830 als "tote Zone" oder Versatz von ungefähr 2,25 dB in der Verstärkungsanstiegskurve dargestellt ist. Daher muß eine SNR-Abschätzung diesen Schwellenwert überschreiten, bevor die Kanalverstärkung über den gezeigten minimalen Verstärkungspegel ansteigen kann. Es ist ebenfalls anzumerken, daß zwei Kurven dargestellt sind, wobei jede einen unterschiedlichen minimalen Verstärkungspegel hat. Die obere mit Gruppe A bezeichnete Kurve, repräsentiert eine untere Kanalgruppe, die zum Beispiel in der bevorzugten Ausführung aus den Kanälen 1-4 besteht, während die Gruppe B die Kanäle 5-14 mit den höheren Frequenzen repräsentiert.
  • Wie aus der grafischen Darstellung ersichtlich ist, haben die niederfrequenten Kanäle einen minimalen Verstärkungswert von -13,1 dB, während die Kanäle mit den oberen Frequenzen einen minimalen Verstärkungswert von -20,7 dB haben. Es ist erkannt worden, daß eine geringere Sprachqualitätsverschlechterung auftritt, wenn die Kanäle in solche Gruppen unterteilt werden. Obwohl in der bevorzugten Ausführung nur zwei verschiedene Verstärkungskurven für den Verstärkungstabellensatz Nr. 1 verwendet werden, kann es sich als vorteilhaft herausstellen, für jeden Kanal eine unterschiedliche Kurve der Verstärkungscharakteristik bereitzustellen. Wie in dem als Bezug genommenen Borth Patent erläutert wird, werden außerdem mehrere Verstärkungstabellensätze verwendet, um eine größere Auswahl von Kanalverstärkungswerten in Abhängigkeit von der jeweiligen Hintergrundrauschumgebung zu gestatten. Die Rauschpegelquantisierungseinrichtung 555 verwendet auf den Gesamthintergrundrauschabschätzungen basierende Hystereseschleifen, um einen bestimmten Verstärkungstabellensatz auszuwählen. Das Verstärkungstabellenauswahlsignal, das von der Rauschpegelquantisierungseinrichtung 555 ausgegeben wird, wird an den Verstärkungstabellenschalter 595 angelegt, um den Vorgang der Verstärkungstabellenauswahl auszuführen. Dementsprechend kann ein Verstärkungstabellensatz aus einer Vielzahl von Verstärkungstabellensätzen 590 als eine Funktion des gesamtdurchschnittlichen Hintergrundrauschpegels gewählt werden.
  • Diese Verbesserungen der Rauschunterdrückung eliminieren die Unbeständigkeit der Hintergrundrauschunterdrückung ohne einen großen Betrag der Verstärkungsglättung zu benötigen. Eine Hintergrundrauschdämpfung innerhalb eines Bereichs von 10 dB bis 25 dB wird mit der vorliegenden Erfindung leicht erreicht. Bei den Verbesserungen erfordert das System eine Verstärkungsglättung, die eine Zeitkonstante von nur 10 bis 20 Millisekunden hat, um einen glatten oder "weißen" Restrauschhintergrund zu erhalten. Frühere Techniken erforderten Zeitkonstanten von 40 bis 60 Millisekunden für die Verstärkungsglättung, die nicht nur in unvollkommener Trillerreduzierung resultierten, sondern ebenfalls die Sprachqualität wesentlich verschlechterten.
  • Da die Gesamtfunktion des verbesserten Rauschunterdrückungssystems ähnlich zu der ist, die in der früheren Beschreibung US-A-4,628,529 nach dem Stand der Technik beschrieben wird, wird das verallgemeinerte Ablaufdiagramm, das in den Figur en 5a/b dieser Anmeldung erläutert wird, nochmals verwendet, um die vorliegende Erfindung zu beschreiben. Der allgemeine Aufbau der Funktion der vorliegenden Erfindung kann nach wie vor in drei funktionale Gruppen eingeteilt werden: Rauschunterdrückungsschleife - Abfolgeblock 604 der vorher beschriebenen Fig. 5a nach dem Stand der Technik, der genauer in der Fig. 6a nach dem Stand der Technik der vorliegenden Erfindung beschrieben wird; automatische Verstärkungsauswahleinrichtung - Abfolge 615 der vorher beschriebenen Fig. 5b nach dem Stand der Technik, die für die vorliegende Erfindung modifiziert worden ist; und automatische Hintergrundrauschabschätzungseinrichtung - Abfolge 621 der Fig. 5b nach dem Stand der Technik, die ebenfalls für die vorliegende Erfindung modifiziert worden ist. Die detaillierten Ablaufdiagramme der Figur en 4a bis 4f der vorliegenden Anmeldung können die Abfolgeblöcke 615 und 621 der Fig. 5b nach dem Stand der Technik ersetzen, um die Funktion des verbesserten Rauschunterdrückungssystems 800 zu beschreiben. Daher beschreiben die Figur en 5a und 6a nach dem Stand der Technik des vorher beschriebenen Borth Patents (4,628,529) die Rauschunterdrückungsschleife, die auf einer Grundlage Abtastwert für Abtastwert durchgeführt wird, während die Figur en 4a bis 4f der vorliegenden Erfindung den Kanalverstärkungsauswahlvorgang und den Hintergrundrauschabschätzungsaktualisierungsvorgang auf einer Grundlage Rahmen für Rahmen beschreiben.
  • Nun auf Fig. 4a Bezug nehmend, die Funktion des verbesserten Rauschunterdrückungssystems 800 beginnt beim "JA" Ausgang des Entscheidungsschritts 614 der zuvor erwähnten Fig. 5a, da die eigentliche spektrale Verstärkungsmodifikationsfunktion für den bestimmten Rahmen bereits auf einer Basis Abtastwert für Abtastwert durch die Verwendung der Verstärkungswerte vom vorherigen Rahmen durchgeführt worden ist. Die Abfolge 850 dient dazu, die auf 235 verfügbaren SNR-Abschätzungen zu erzeugen. Zu allererst wird der Kanalzähler CC im Schritt 851 auf Eins gesetzt. Als nächstes wird die Sprachmaßsummenvariable VMSUM im Schritt 852 auf Null initialisiert. Der Schritt 853 berechnet den ursprünglichen Signal-Rausch-Abstand SNR für den bestimmten Kanal als einen SNR-Abschätzungsindexwert INDEX(CC). Die SNR-Berechnung ist einfach eine Division der auf 225 verfügbaren kanalweisen Energieabschätzungen (Signal plus Rauschen) durch die kanalweisen Hintergrundrauschabschätzungen (Rauschen) auf 325. Es können jedoch alternativ andere Abschätzungen des Signal-Rausch-Schwellenwerts verwendet werden. Deshalb dividiert der Schritt 853 einfach die momentan gespeicherte Kanalenergieabschätzung (vom Ablaufdiagrammschritt 707 der zuvor erwähnten Fig. 6a erhalten) durch die momentane Hintergrundrauschabschätzung BNE(CC) vom vorherigen Rahmen.
  • In der Abfolge 860 werden die Sprachmaße berechnet. Zuerst wird die Sprachmaßtabelle für den bestimmten Kanal im Schritt 861 indexiert, indem der ursprüngliche SNR-Abschätzungsindex INDEX(CC) verwendet wird. Die Sprachmaßtabelle wird im Schritt 862 gelesen, um einen Sprachmaßwert VM(CC) für diesen speziellen Kanal zu erhalten. Dieser einzelne Kanalsprachmaßwert wird im Schritt 863 zu der Sprachmaßsumme VMSUM hinzuaddiert. Der Kanalzähler CC wird im Schritt 864 erhöht und im Schritt 865 geprüft. Wenn nicht die Sprachmaße für alle N Kanäle berechnet worden sind, kehrt die Steuerung zum Schritt 853 zurück.
  • Die Abfolge 870 erläutert den Entscheidungsvorgang der Hintergrundrauschabschätzungsaktualisierung, der durch die Sprachmaßberechnungseinrichtung 810 durchgeführt wird. Die Sprachmaßsumme VMSUM wird im Schritt 871 mit dem AKTUALISIERUNGSSCHWELLENWERT verglichen. Wenn VMSUM kleiner oder gleich dem AKTUALISIERUNGSSCHWELLENWERT ist, dann ist der Rahmen wahrscheinlich ein Rauschrahmen. Das ZEITGEBERKENNZEICHENBIT wird im Schritt 872 zurückgesetzt und der Aktualisierungszähler UC wird im Schritt 873 zurückgesetzt. Die Steuerung geht zum Schritt 878 über, wo das AKTUALISIERUNGSKENNZEICHENBIT als wahr eingestellt wird, was bedeutet, daß eine Hintergrundrauschabschätzungsaktualisierung für den momentanen Rahmen durchgeführt werden wird.
  • Wenn VMSUM größer als der AKTUALISIERUNGSSCHWELLENWERT ist, ist der Rahmen wahrscheinlich ein Sprachrahmen. Nichtsdestoweniger prüft der Schritt 874 das ZEITGEBERKENNZEICHENBIT um festzustellen, ob ein plötzliches, lautes Anwachsen des Hintergrundrauschs als Sprache interpretiert worden ist. Wenn das ZEITGEBERKENNZEICHENBIT einen wahren Zustand hat, ist das eine zweite Zeitintervall vor einigen Rahmen überschritten worden und eine Hintergrundrauschabschätzungsaktualisierung ist immer noch notwendig. Dies beruht auf der Tatsache, daß für jeden Rahmen nur eine teilweise Hintergrundrauschaktualisierung durchgeführt wird. Wenn das ZEITGEBERKENNZEICHENBIT keinen wahren Zustand hat, wird der Aktualisierungszähler UC im Schritt 875 erhöht und im Schritt 876 geprüft. Wenn seit der letzten Hintergrundrauschabschätzungsaktualisierung 100 Rahmen aufgetreten sind, wird das ZEITGEBERKENNZEICHENBIT im Schritt 877 auf den wahren Zustand gesetzt und das BNE AKTUALISIERUNGSKENNZEICHENBIT wird im Schritt 878 auf einen wahren Zustand gesetzt. Es werden dann eine Reihe von teilweisen Hintergrundrauschabschätzungsaktualisierungen durchgeführt, bis die Sprachmaßsumme VMSUM wieder unter den AKTUALISIERUNGSSCHWELLENWERT sinkt. Es ist anzumerken, daß sich die einzige Stelle im Ablaufdiagramm, die das ZEITGEBERKENNZEICHENBIT zurücksetzt, im Schritt 872 befindet, wenn die Sprachmaßsumme VMSUM wieder Rauschen ähnelt. Wenn der Aktualisierungszähler UC 100 Rahmen nicht erreicht hat, scheint der jetzige Rahmen ein Sprachrahmen zu sein, und es wird keine Hintergrundrauschaktualisierung durchgeführt.
  • Nun auf die Abfolge 880 der Figur en 4b und 4c Bezug nehmend, die Entscheidung, die Kanal-Signal-Rausch-Abstände zu modifizieren, wird als nächstes durchgeführt. Im Schritt 881 wird eine Indexzählervariable IC initialisiert. Der Kanalzähler CC wird im Schritt 882 auf 5 gesetzt, um nur die oberen 10 der 14 Kanäle, die eine hohe Energie haben, zu zählen. Der ursprüngliche SNR-Abschätzungsindex INDEX(CC) wird im Schritt 883 geprüft um festzustellen, ob er einen INDEXSCHWELLENWERT erreicht hat, der ungefähr 6 dB SNR entsprechen würde. Hier wird die Annahme gemacht, daß zumindest 5 der oberen 10 Kanäle eines Sprachrahmens Energie enthalten sollten, die einen SNR von zumindest 6 dB hat. Wenn der bestimmte SNR INDEX(CC) über dem INDEXSCHWELLENWERT liegt, wird der Indexzähler IC im Schritt 884 erhöht. Wenn nicht, wird der Kanalzähler CC im Schritt 885 erhöht und im Schritt 886 geprüft, um den nächsten Kanal zu untersuchen.
  • Wenn alle 10 obere Kanäle gemessen worden sind, stellt der Indexzähler IC die Anzahl der Kanäle dar, die eine SNR- Abschätzungsindex haben, der größer als der INDEXSCHWELLENWERT ist. Der Indexzähler IC wird dann im Schritt 887 mit einem ZÄHLERSCHWELLENWERT verglichen. Wenn IC anzeigt, daß mehr Kanäle als der ZAHLERSCHWELLENWERT, zum Beispiel 5 der oberen 10 Kanäle, ausreichend Energie enthalten, dann ist der Rahmen wahrscheinlich ein Sprachrahmen und das MODIFIZIERUNGSKENNZEICHENBIT wird im Schritt 889 in den unwahren Zustand gesetzt, um die Kanal-SNR-Modifizierung zu verhindern. Wenn nur wenige Kanäle hohe Energie enthalten, was einen Rahmen mit Schmalbandrauschen darstellen würde, dann wird das MODIFIZIERUNGSKENNZEICHENBIT im Schritt 888 auf den wahren Zustand gesetzt.
  • Die Abfolge 890 beschreibt den SNR-Modifizierungsvorgang, der durch den Kanal-SNR-Modifizierungsblock 820 durchgeführt wird. Anfangs wird das MODIFIZIERUNGSKENNZEICHENBIT im Schritt 891 geprüft. Wenn es im unwahren Zustand ist, wird der Kanal-SNR-Modifizierungsvorgang übergangen. Wenn das MODIFIZIERUNGSKENNZEICHENBIT wahr ist, wird der Kanalzähler CC im Schritt 892 initialisiert. Danach wird jeder Kanal-SNR- Abschätzungsindex im Schritt 893 geprüft um festzustellen, ob er kleiner oder gleich einem ZURÜCKSETZUNGSSCHWELLENWERT ist. Der ZURÜCKSETZUNGSSCHWELLENWERT, der einen Wert haben kann, der 6 dB SNR entspricht, stellt die maximale SNR-Abschätzung dar, die Hintergrundrauschtrillern darstellt. Nur Kanäle, die einen geringen SNR-Abschätzungsindex haben, bestehen diese Prüfung. Jedoch selbst wenn der Kanalindex größer als der ZURÜCKSETZUNGSSCHWELLENWERT ist, wird die Sprachmaßsumme VMSUM nochmals im Schritt 894 geprüft. Wenn VMSUM kleiner oder gleich einem MASSSCHWELLENWERT ist, der der Darstellung eines Gesamtsprachmasses eines Schmalbandrauschrahmens entspricht, wird der INDEX(CC) im Schritt 895 durch das Gleichsetzen mit dem minimalen Indexwert von 1 modifiziert. Der Kanalzähler CC wird im Schritt 896 erhöht und im Schritt 897 geprüft um festzustellen, ob alle Kanäle überprüft worden sind. Wenn nicht, kehrt die Steuerung zum Schritt 893 zurück, um den nächsten Kanalindex zu überprüfen. Daher wird ein Rahmen, der entweder Kanalenergieschwankungen oder Schmalbandrauschen enthält, modifiziert, so daß der Rahmen keine unerwünschten Verstärkungsveränderungen hervorruft.
  • Die Abfolge 900 führt die Funktionen des SNR-Schwellenwertblocks 830 aus. Der Kanalzähler CC wird im Schritt 901 initialisiert. Der SNR-Index für den bestimmten Kanal wird im Schritt 902 mit einen SNR-SCHWELLENWERT verglichen. In der bevorzugten Ausführung stellt der SNR-SCHWELLENWERT einen Indexwert dar, der 2,25 dB SNR entspricht. Wenn INDEX(CC) über dem SNR-SCHWELLENWERT liegt, kann er verwendet werden, die Verstärkungstabelle zu indexieren. Wenn nicht, wird der Indexwert im Schritt 903 wieder auf 1 gesetzt, was den minimalen Indexwert darstellt. Der Kanalzähler CC wird im Schritt 904 erhöht und im Schritt 905 geprüft. Dieser SNR-Schwellenwertprüfvorgang dient dazu, die geringen Hintergrundrauschveränderungen in allen Kanälen zu reduzieren.
  • Nun Bezug auf die Abfolge 910 der Fig. 4d nehmend, die Verstärkungstabellensätze werden durch die Rauschpegelquantisierungseinrichtung 555 und den Verstärkungstabellenschalter 595 ausgewählt. Im Schritt 911 wird der Kanalzähler CC initialisiert und im Schritt 912 wird eine Variable initialisiert, die Hintergrundrauschabschätzungssumme BNESUM genannt wird. Im Schritt 913 wird die momentane Hintergrundrauschabschätzung BNE(CC) für jeden Kanal gewonnen und im Schritt 914 zu BNESUM aufaddiert. Der Schritt 915 erhöht den Kanalzähler CC und der Schritt 916 prüft den Kanalzähler um festzustellen, ob die Hintergrundrauschabschätzungen für alle N Kanäle aufsummiert worden sind.
  • Im Schritt 917 wird BNESUM mit einem ersten Hintergrundrauschabschätzungsschwellenwert verglichen. Wenn sie größer als der BNE SCHWELLENWERT 1 ist, dann wird im Schritt 918 der Verstärkungstabellensatz Nr. 1 ausgewählt. Ähnlicherweise prüft der Schritt 919 nochmals BNESUM um festzustellen, ob sie größer als der geringere Wert von BNE SCHWELLENWERT 2 ist. Wenn BNESUM größer als BNE SCHWELLENWERT 2, aber kleiner als BNE SCHWELLENWERT 1 ist, dann wird im Schritt 920 der Verstärkungstabellensatz Nr. 2 ausgewählt. Andernfalls wird im Schritt 921 der Verstärkungstabellensatz Nr. 3 ausgewählt. Daher werden die Verstärkungstabellensätze 590 als eine Funktion des gesamtdurchschnittlichen Hintergrundrauschpegels ausgewählt.
  • Die Abfolge 930 beschreibt die Schritte zur Gewinnung der ursprünglichen Verstärkungswerte RG(CC) aus den Verstärkungstabellensätzen 590. Der Schritt 931 setzt den Kanalzähler CC auf 1. Die ausgewählte Verstärkungstabelle wird im Schritt 932 indexiert, indem der Kanal-SNR-Abschätzungsindex INDEX(CC) verwendet wird, der die SNR-Modifikation und die Schwellenwertprüfungen passiert hat. Der ursprüngliche Ver stärkungswert RG(CC) wird im Schritt 933 aus der gewählten Verstärkungstabelle gewonnen und wird dann im Schritt 934 für den Gebrauch als Verstärkungswert für den nächsten Rahmen der Rauschunterdrückung gespeichert. Der Kanalzähler CC wird im Schritt 935 erhöht und im Schritt 936 wie zuvor geprüft. Wie im U. S. Patent Nr. 4,630,305 beschrieben, werden die ursprünglichen Verstärkungswerte für jeden Kanal auf 535 dann auf einer abtastwertweisen Grundlage an die Verstärkungsglättungsfilter 530 zur Glättung angelegt.
  • Schließlich beschreibt die Abfolge 940 den eigentlichen Aktualisierungvorgang der Hintergrundrauschabschätzung, der im Block 420 der Fig. 1 durchgeführt wird. Der Schritt 941 prüft anfangs das AKTUALISIERUNGSKENNZEICHENBIT um festzustellen, ob eine Hintergrundrauschabschätzung durchgeführt werden sollte. Wenn das AKTUALISIERUNGSKENNZEICHENBIT unwahr ist, dann ist der Rahmen ein Sprachrahmen und es kann keine Hintergrundrauschaktualisierung auftreten. Andernfalls wird die Hintergrundrauschaktualisierung, die durch das Schließen des Kanalschalters 575 simuliert wird, während eines Rauschrahmens durchgeführt. Im Schritt 942 wird das AKTUALISIERUNGSKENNZEICHENBIT auf den unwahren Zustand zurückgesetzt. Die Schritte 942 bis 945 dienen dazu, die momentane Hintergrundrauschabschätzung in jedem der N Kanäle über folgende Gleichung zu aktualisieren:
  • E(i,k) = E(i, k - 1) + SF[(PE(i) - E(i, k - 1)],
  • i = 1, 2, ..., N
  • wobei E(i, k) die momentane Energierauschabschätzung für den Kanal (i) zum Zeitpunkt (k) ist, E (i, k - 1) ist die alte Energierauschabschätzung für den Kanal (1) zum Zeitpunkt (k - 1), PE(i) ist die momentane vorverarbeitete Energieabschätzung für den Kanal (i) und SF ist die Glättungsfaktorzeitkonstante, die bei der Glättung der Hintergrundrausch abschätzungen verwendet wird. Deswegen wird E(i, k - 1) im Energieabschätzungsspeicherregister 585 gespeichert, und der SF-Term führt die Funktion des Glättungsfilters 580 aus. In der bevorzugten Ausführung wird SF gewählt, 0,1 für eine Rahmendauer von 10 Millisekunden zu sein.
  • Der Schritt 943 initialisiert den Kanalzähler CC auf 1. Der Schritt 944 führt die obige Gleichung in Bezug auf die auf 225 verfügbare momentane Hintergrundrauschabschätzung aus, wobei die alte Hintergrundrauschabschätzung auf 325 verfügbar ist, die alte Hintergrundrauschabschätzung ALTE BNE(CC) im Energieabschätzungsspeicherregister 585 gespeichert ist und die neue Hintergrundrauschabschätzung NEUE BNE(CC) vom Schalter 575 verfügbar ist. Der Schritt 945 erhöht den Kanalzähler CC und der Schritt 946 prüft um festzustellen, ob alle N Kanäle verarbeitet worden sind. Wenn ja, ist die Hintergrundrauschabschätzungsaktualisierung beendet und die Funktion kehrt zum Schritt 629 der Fig. 5b des zuvor erwähnten Borth Patents zurück, um den Abtastwertzähler zurückzusetzen und den Rahmenzähler zu erhöhen. Die Steuerung kehrt dann wieder zurück, um die Rauschunterdrückung auf einer Grundlage Abtastwert für Abtastwert für den nächsten Rahmen durchzuführen.
  • Zurückblickend kann nun gesehen werden, daß die vorliegende Erfindung die folgenden Verbesserungen gewährleistet: (a) eine Reduzierung des Hintergrundrauschtrillerns durch Verschiebung des Verstärkungsanstiegs der Verstärkungstabellen bis ein bestimmter SNR-Wert erreicht wird; (b) Schutz vor Schmalbandrauschbündeln durch Modifikation der SNR- Abschätzungen auf der Grundlage der Sprachmaßberechnung und der Kanalenergien; und (c) genauere Hintergrundrauschabschätzungen durch die Durchführung der Aktualisierungsentscheidung auf der Grundlage des Gesamtsprachmasses und des Zeitintervalls seit der letzten Aktualisierung.
  • Während spezielle Ausführungen der vorliegenden Erfindung hierin gezeigt und beschrieben worden sind, können durch Fachmänner weitere Modifikationen und Verbesserungen gemacht werden. Zum Beispiel wird der Funktionsablauf hierin beschrieben, daß er im Echtzeitbetrieb durchgeführt wird. Wegen der innewohnenden Hardwarebeschränkungen jedoch können die vorherigen Hintergrundrauschabschätzungen für die Kanalverstärkungswerte für die Benutzung im nächsten Rahmen gespeichert werden. Alle solche Modifikationen, die auf die offenbarten, zugrundegelegten Prinzipien zurückgreifen, und die hierin enthaltenen Ansprüche fallen in den Bereich dieser Erfindung.

Claims (20)

1. Rauschunterdrückungssystem (800) zur Dämpfung des Hintergrundrauschens von einem verrauschten Eingangssignal (205), um ein rauschunterdrücktes Ausgangssignal (265) zu erzeugen, wobei dieses Rauschunterdrückungssystem umfaßt:
- Mittel (210) zur Aufteilung des Eingangssignals (205) in eine Vielzahl von vorverarbeiteteh Signalen, die ausgewählte Frequenzkanäle darstellen;
- Mittel (220) zur Erzeugung von Abschätzungen der Signalplus-Rausch-Energie und der Rauschenergie in jedem einzelnen Kanal; und
- Mittel (310, 810) zur Erzeugung eines Verstärkungswerts für jeden einzelnen Kanal in Reaktion auf diese Kanalenergieabschätzungen; wobei das System (800) dadurch gekennzeichnet ist, daß:
- diese Verstärkungswerte für jeden Kanal einen minimalen Verstärkungswert haben;
- diese Mittel (310, 810) zur Erzeugung eines Verstärkungswerts Schwellenwertmittel enthalten, die gestatten, daß Verstärkungswerte oberhalb dieses minimalen Verstärkungswerts nur erzeugt werden, wenn diese Signal-plus- Rausch-Energieabschätzungen diese Rauschenergieabschätzungen um einen vorbestimmten Betrag überschreiten; und
- Mittel zur Modifizierung der Verstärkung jedes aus der Vielzahl vorverarbeiteter Signale in Reaktion auf diese Verstärkungswerte, um eine Vielzahl nachverarbeiteter Signale bereitzustellen.
2. Rauschunterdrückungssystem nach Anspruch 1, wobei diese Mittel (310; 810) zur Erzeugung eines Verstärkungswerts auf der Grundlage des Signal-Rausch-Abstands (SNR) dieser Kanalenergieabschätzungen Verstärkungswerte erzeugt und wobei diese SNR-Abschätzungen mit einem vordefinierten SNR-Schwellenwert verglichen werden, so daß Kanäle, die SNR-Abschätzungen unter diesem SNR-Schwellenwert haben, minimale Verstärkungswerte erzeugen.
3. Rauschunterdrückungssystem nach Anspruch 2, wobei dieser vordefinierte SNR-Schwellenwert einem SNR-Wert innerhalb des Bereichs von 1,5 dB bis 5 dB SNR entspricht.
4. Rauschunterdrückungssystem nach Anspruch 3, wobei dieser vordefinierte SNR-Schwellenwert einem SNR-Wert von ungefähr 2,25 dB SNR entspricht.
5. Rauschunterdrückungssystem nach einem der vorhergehenden Ansprüche, wobei diese verstärkungsmodifizierenden Mittel einen maximalen Betrag der Dämpfung des vorverarbeiteten Signals in einem bestimmten Kanal, der einen minimalen Verstärkungswert hat, gewährleisten.
6. Rauschunterdrückungssystem nach einem der vorhergehenden Ansprüche, wobei die Verstärkungswerte einen größeren Betrag der Dämpfung für Kanäle mit hohen Frequenzen als für Kanäle mit niedrigen Frequenzen erzeugen.
7. Rauschunterdrückungssystem nach einem der vorhergehenden Ansprüche, wobei diese Mittel (310, 810) zur Erzeugung eines Verstärkungswerts weiter eine Vielzahl von Verstärkungstabellen enthalten, wobei jede Verstärkungstabelle vorbestimmte einzelne Kanalverstärkungswerte entsprechend dieser einzelnen Kanalenergieabschätzungen hat, und wobei Verstärkungstabellenauswahlmittel zur automatischen Auswahl einer Verstärkungstabelle aus dieser Vielzahl von Verstärkungstabellen als eine Funktion des gesamtdurchschnittlichen Hintergrundrauschpegels dieses Eingangssignals vorhanden sind.
8. Rauschunterdrückungssystem nach einem der vorhergehenden Ansprüche, das weiter Mittel zur Kombinierung dieser Vielzahl nachverarbeiteter Signale enthält, um dieses rauschunterdrückte Ausgangssignal zu erzeugen.
9. Rauschunterdrückungssystem nach einem der vorhergehenden Ansprüche, wobei diese Mittel (220) zur Erzeugung der Abschätzungen enthalten:
- Mittel zur Erzeugung und Speicherung einer Abschätzung der Hintergrundrauschleistungsspektraldichte dieser vorverarbeiteten Signale, wobei diese hintergrundrauschabschätzungserzeugenden Mittel Mittel zur Modifizierung dieser Hintergrundrauschabschätzung in Reaktion auf einen Zeitparameter enthalten, der eine Anzeige des Zeitintervalls seit der vorherigen Hintergrundrauschabschätzungsmodifikation ist; und
- Mittel zur Erzeugung einer Abschätzung des Signal- Rausch-Abstands (SNR) in jedem einzelnen Kanal auf der Grundlage dieser modifizierten Hintergrundrauschabschätzungen;
wobei diese Mittel (310, 810) zur Erzeugung eines Verstärkungswerts für jeden einzelnen Kanal jeden Verstärkungswert in Reaktion auf diese Kanal-SNR-Abschätzungen erzeugen.
10. Rauschunterdrückungssystem nach Anspruch 9, wobei diese hintergrundrauschabschätzungsmodifizierenden Mittel Mittel zur Erzeugung dieses Zeitparameters und Mittel zum Vergleich dieses Zeitparameters mit einem vorbestimmten Zeitgeberschwellenwert enthalten, so daß eine Hintergrundrauschabschätzungsmodifikation durchgeführt wird, wenn dieser Zeitparameter diesen Zeitgeberschwellenwert überschreitet.
11. Rauschunterdrückungssystem nach Anspruch 10, wobei diese hintergrundrauschabschätzungsmodifizierenden Mittel weiter Mittel zur Erzeugung einer Abschätzung der Energie in jedem einzelnen Kanal und Mittel zur Erzeugung eines Mehrkanalenergieparameters in Reaktion auf den Gesamtwert aller einzelnen Kanalenergleabschätzungen enthalten.
12. Rauschunterdrückungssystem nach Anspruch 11, wobei diese mehrkanalenergieparametererzeugenden Mittel sich geringen Veränderungen der einzelnen Kanalenergieabschätzungen anpassen, so daß diese geringen Veränderungen diesen Mehrkanalenergieparameter nicht wesentlich beeinflussen.
13. Rauschunterdrückungssystem nach Anspruch 11 oder 12, wobei diese hintergrundrauschabschätzungsmodifizierenden Mittel weiter Mittel zum Vergleich dieses Mehrkanalenergieparameters mit einem Vorbestimmten Energieschwellenwert enthalten, so daß eine Hintergrundrauschabschätzungsmodifikation durchgeführt wird, wenn dieser Mehrkanalenergieparameter kleiner als dieser Energieschwellenwert ist.
14. Rauschunterdrückungssystem nach Anspruch 13, wobei diese hintergrundrauschabschätzungsmodifizierenden Mittel diese Hintergrundrauschabschätzungen in Reaktion auf diesen Zeitparameter modifizieren, ungeachtet dieses Mehrkanalenergieparameters.
15. Rauschunterdrückungssystem nach einem der Ansprüche 11 bis 14, wobei dieser Mehrkanalenergieparameter dadurch erzeugt wird, daß diese einzelnen Kanal-SNR-Abschätzungen die einzelnen Kanalsprachmaße übersetzen, wobei die Sprachmaßsumme eine Messung der gesamten sprachähnlichen Charakteristiken der Energie in allen Kanälen ist.
16. Rauschunterdrückungssystem nach einem der vorhergehenden Ansprüche, weiter umfassend:
- Mittel (815, 820, 830) zur Überwachung dieser Kanalenergieabschätzungen und zur Unterscheidung der Schmalbandrauschbündel von Sprachenergie und Hintergrundrauschenergie, wodurch ein Modifikationssignal (835) erzeugt wird;
- Mittel (590) zur selektiven Modifizierung dieser Kanalenergieabschätzungen in Reaktion auf dieses Modifikationssignal (835), so daß Kanalenergleabschätzungen, die Schmalbandrauschbündel darstellen, modifiziert werden;
- Mittel zur Erzeugung eines Verstärkungswerts für jeden einzelnen Kanal in Reaktion auf jede modifizierte Kanalenergieabschätzung; und
- Mittel zur Modifizierung der Verstärkung jedes aus dieser Vielzahl vorverarbeiteter Signale in Reaktion auf diese Verstärkungswerte, um eine Vielzahl nachverarbeiteter Signale bereitzustellen.
17. Rauschunterdrückungssystem nach Anspruch 16, wobei dieses Modifikationssignal eine Anzeige der Gesamtanzahl der einzelnen Kanäle ist, die Energieabschätzungen haben, die einen vorbestimmten Energieschwellenwert überschreiten.
18. Rauschunterdrückungssystem nach Anspruch 16 oder 17, wobei diese kanalenergieabschätzungsmodifizierenden Mittel Mittel (830) zum Vergleich dieses Modifikationssignals mit einem vorbestimmten Zählerschwellenwert enthalten, so daß eine Kanalenergieabschätzungsmodifikation durchgeführt wird, wenn diese Gesamtanzahl der einzelnen Kanäle kleiner als dieser Zählerschwellenwert ist.
19. Rauschunterdrückungssystem nach Anspruch 16, 17 oder 18, wobei diese verstärkungsmodifizierenden Mittel einen maximalen Betrag der Dämpfung des vorverarbeiteten Signals in einem bestimmten Kanal, der eine modifizierte Kanalenergieabschätzung hat, gewährleisten.
20. Verfahren zur Dämpfung des Hintergrundrauschens eines verrauschten Eingangssignals (205), um in einem Rauschunterdrückungssystem (800) ein rauschunterdrücktes Ausgangssignal (265) zu erzeugen, wobei das Verfahren die folgenden Schritte umfaßt:
- Aufteilung (850) des Eingangssignals in eine Vielzahl vorverarbeiteter Signale, die durch eine Anzahl von N ausgewählten Frequenzkanälen dargestellt werden;
- Erzeugung einer Abschätzung der Energie in jedem einzelnen Kanal (853);
- Erzeugung und Speicherung einer Abschätzung der Hintergrundrauschleistungsspektraldichte dieser vorverarbeiteten Signale; und
- Erzeugung einer Abschätzung des Signal-Rausch- Abstands (SNR) in jedem einzelnen Kanal auf der Grundlage dieser Hintergrundrauschabschätzungen und dieser Kanalenergieabschätzungen;
wobei das Verfahren durch die folgenden Schritte gekennzeichnet ist:
- Erzeugung (861, 862) eines Verstärkungswerts für jeden einzelnen Kanal in Reaktion auf diese Kanal- SNR-Abschätzungen, wobei diese Verstärkungswerte einen Bereich minimaler Werte haben;
und wobei dieser verstärkungswerterzeugende Schritt die folgenden Schritte enthält:
- Bereitstellung eines vordefinierten SNR-Schwellenwerts und Vergleich (902) dieser Kanal-SNR-Abschätzungen mit diesem vordefinierten SNR-Schwellenwert, so daß Kanäle, die SNR-Abschätzungen unter diesem SNR-Schwellenwert haben, Verstärkungswerte innerhalb dieses minimalen Bereichs erzeugen; und
- Modifizierung (910) der Verstärkung jedes aus dieser Vielzahl vorverarbeiteter Signale in Reaktion auf diese Verstärkungswerte, um eine Vielzahl nachverarbeiteter Signale bereitzustellen.
DE3856280T 1987-10-01 1988-09-22 Rauschunterdrückungssystem Expired - Lifetime DE3856280T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/103,857 US4811404A (en) 1987-10-01 1987-10-01 Noise suppression system
PCT/US1988/003269 WO1989003141A1 (en) 1987-10-01 1988-09-22 Improved noise suppression system

Publications (2)

Publication Number Publication Date
DE3856280D1 DE3856280D1 (de) 1999-01-21
DE3856280T2 true DE3856280T2 (de) 1999-08-12

Family

ID=22297382

Family Applications (1)

Application Number Title Priority Date Filing Date
DE3856280T Expired - Lifetime DE3856280T2 (de) 1987-10-01 1988-09-22 Rauschunterdrückungssystem

Country Status (6)

Country Link
US (1) US4811404A (de)
EP (1) EP0380563B1 (de)
JP (1) JP2995737B2 (de)
KR (1) KR970000789B1 (de)
DE (1) DE3856280T2 (de)
WO (1) WO1989003141A1 (de)

Families Citing this family (205)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4956867A (en) * 1989-04-20 1990-09-11 Massachusetts Institute Of Technology Adaptive beamforming for noise reduction
US5036540A (en) * 1989-09-28 1991-07-30 Motorola, Inc. Speech operated noise attenuation device
AU633673B2 (en) * 1990-01-18 1993-02-04 Matsushita Electric Industrial Co., Ltd. Signal processing device
EP0449199B1 (de) * 1990-03-28 1995-07-05 Pioneer Electronic Corporation Rauschreduktionsschaltung
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
DE69127495T2 (de) * 1990-05-16 1998-01-08 Matsushita Electric Ind Co Ltd Erkennungseinheit und Gerät zur Erkennung und Beurteilung in dem die Einheit verwendet ist
US5203016A (en) * 1990-06-28 1993-04-13 Harris Corporation Signal quality-dependent adaptive recursive integrator
US5152007A (en) * 1991-04-23 1992-09-29 Motorola, Inc. Method and apparatus for detecting speech
CA2483322C (en) * 1991-06-11 2008-09-23 Qualcomm Incorporated Error masking in a variable rate vocoder
JPH05134694A (ja) * 1991-11-15 1993-05-28 Sony Corp 音声認識装置
US5410632A (en) * 1991-12-23 1995-04-25 Motorola, Inc. Variable hangover time in a voice activity detector
JPH05188994A (ja) * 1992-01-07 1993-07-30 Sony Corp 騒音抑圧装置
US5319573A (en) * 1992-01-15 1994-06-07 Motorola, Inc. Method and apparatus for noise burst detection in a signal processor
US5349701A (en) * 1992-01-15 1994-09-20 Motorola, Inc. Method and apparatus for broken link detect using audio energy level
FI92535C (fi) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
US5309443A (en) * 1992-06-04 1994-05-03 Motorola, Inc. Dynamic muting method for ADPCM coded speech
US5430826A (en) * 1992-10-13 1995-07-04 Harris Corporation Voice-activated switch
US5732143A (en) * 1992-10-29 1998-03-24 Andrea Electronics Corp. Noise cancellation apparatus
DE4307688A1 (de) * 1993-03-11 1994-09-15 Daimler Benz Ag Verfahren zur Geräuschreduktion für gestörte Sprachkanäle
US5400409A (en) * 1992-12-23 1995-03-21 Daimler-Benz Ag Noise-reduction method for noise-affected voice channels
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
WO1995002288A1 (en) * 1993-07-07 1995-01-19 Picturetel Corporation Reduction of background noise for speech enhancement
US5488666A (en) * 1993-10-01 1996-01-30 Greenhalgh Technologies System for suppressing sound from a flame
US5526419A (en) * 1993-12-29 1996-06-11 At&T Corp. Background noise compensation in a telephone set
US5825671A (en) * 1994-03-16 1998-10-20 U.S. Philips Corporation Signal-source characterization system
US5581620A (en) * 1994-04-21 1996-12-03 Brown University Research Foundation Methods and apparatus for adaptive beamforming
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
US5666429A (en) * 1994-07-18 1997-09-09 Motorola, Inc. Energy estimator and method therefor
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
US5768473A (en) * 1995-01-30 1998-06-16 Noise Cancellation Technologies, Inc. Adaptive speech filter
JP3591068B2 (ja) * 1995-06-30 2004-11-17 ソニー株式会社 音声信号の雑音低減方法
US5844994A (en) * 1995-08-28 1998-12-01 Intel Corporation Automatic microphone calibration for video teleconferencing
EP0852052B1 (de) * 1995-09-14 2001-06-13 Ericsson Inc. System zur adaptiven filterung von tonsignalen zur verbesserung der sprachverständlichkeit bei umgebungsgeräuschen
US5687243A (en) * 1995-09-29 1997-11-11 Motorola, Inc. Noise suppression apparatus and method
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US5768392A (en) * 1996-04-16 1998-06-16 Aura Systems Inc. Blind adaptive filtering of unknown signals in unknown noise in quasi-closed loop system
JPH09326844A (ja) * 1996-06-03 1997-12-16 Mitsubishi Electric Corp 騒音低減通話装置及び騒音低減通話方法
US5825898A (en) * 1996-06-27 1998-10-20 Lamar Signal Processing Ltd. System and method for adaptive interference cancelling
US5864793A (en) * 1996-08-06 1999-01-26 Cirrus Logic, Inc. Persistence and dynamic threshold based intermittent signal detector
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
US5963899A (en) * 1996-08-07 1999-10-05 U S West, Inc. Method and system for region based filtering of speech
KR100250561B1 (ko) 1996-08-29 2000-04-01 니시무로 타이죠 잡음소거기 및 이 잡음소거기를 사용한 통신장치
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
US6097820A (en) * 1996-12-23 2000-08-01 Lucent Technologies Inc. System and method for suppressing noise in digitally represented voice signals
KR20000064767A (ko) * 1997-01-23 2000-11-06 비센트 비.인그라시아 통신 시스템의 비선형 처리 장치 및 방법
US5937377A (en) * 1997-02-19 1999-08-10 Sony Corporation Method and apparatus for utilizing noise reducer to implement voice gain control and equalization
US6104993A (en) * 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
US6178248B1 (en) 1997-04-14 2001-01-23 Andrea Electronics Corporation Dual-processing interference cancelling system and method
US6115589A (en) * 1997-04-29 2000-09-05 Motorola, Inc. Speech-operated noise attenuation device (SONAD) control system method and apparatus
WO1999012155A1 (en) * 1997-09-30 1999-03-11 Qualcomm Incorporated Channel gain modification system and method for noise reduction in voice communication
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
SE515674C2 (sv) * 1997-12-05 2001-09-24 Ericsson Telefon Ab L M Apparat och metod för brusreducering
US6070137A (en) * 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
US6459914B1 (en) * 1998-05-27 2002-10-01 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging
US6088668A (en) * 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6453285B1 (en) 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6122610A (en) * 1998-09-23 2000-09-19 Verance Corporation Noise suppression for low bitrate speech coder
US6718301B1 (en) 1998-11-11 2004-04-06 Starkey Laboratories, Inc. System for measuring speech content in sound
EP1729287A1 (de) * 1999-01-07 2006-12-06 Tellabs Operations, Inc. Verfahren und Vorrichtung für adaptive Rauschunterdrückung
DK1141948T3 (da) 1999-01-07 2007-08-13 Tellabs Operations Inc Fremgangsmåde og apparat til adaptiv undertrykkelse af stöj
FI118359B (fi) * 1999-01-18 2007-10-15 Nokia Corp Menetelmä puheentunnistuksessa ja puheentunnistuslaite ja langaton viestin
US6604071B1 (en) * 1999-02-09 2003-08-05 At&T Corp. Speech enhancement with gain limitations based on speech activity
US6363345B1 (en) 1999-02-18 2002-03-26 Andrea Electronics Corporation System, method and apparatus for cancelling noise
JP2000259198A (ja) * 1999-03-04 2000-09-22 Sony Corp パターン認識装置および方法、並びに提供媒体
GB2349259B (en) * 1999-04-23 2003-11-12 Canon Kk Speech processing apparatus and method
JP2001016057A (ja) 1999-07-01 2001-01-19 Matsushita Electric Ind Co Ltd 音響装置
US7117149B1 (en) * 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
WO2001024167A1 (fr) * 1999-09-30 2001-04-05 Fujitsu Limited Dispositif antiparasite
DK1219138T3 (da) * 1999-10-07 2004-04-13 Widex As Fremgangsmåde og signalprocessor til intensivering af talesignalkomponenter i et høreapparat
US6594367B1 (en) 1999-10-25 2003-07-15 Andrea Electronics Corporation Super directional beamforming design and implementation
JP3454206B2 (ja) * 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US7058572B1 (en) 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
JP3949453B2 (ja) 2000-02-18 2007-07-25 日本碍子株式会社 セラミックス構造体の製造方法
US6804640B1 (en) * 2000-02-29 2004-10-12 Nuance Communications Signal noise reduction using magnitude-domain spectral subtraction
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6766292B1 (en) * 2000-03-28 2004-07-20 Tellabs Operations, Inc. Relative noise ratio weighting techniques for adaptive noise cancellation
US6507653B1 (en) * 2000-04-14 2003-01-14 Ericsson Inc. Desired voice detection in echo suppression
US6931292B1 (en) 2000-06-19 2005-08-16 Jabra Corporation Noise reduction method and apparatus
US6741873B1 (en) * 2000-07-05 2004-05-25 Motorola, Inc. Background noise adaptable speaker phone for use in a mobile communication device
JP2002032096A (ja) 2000-07-18 2002-01-31 Matsushita Electric Ind Co Ltd 雑音区間/音声区間判定装置
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
JP2002149200A (ja) 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
WO2002056303A2 (en) * 2000-11-22 2002-07-18 Defense Group Inc. Noise filtering utilizing non-gaussian signal statistics
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
EP1376539B8 (de) * 2001-03-28 2010-12-15 Mitsubishi Denki Kabushiki Kaisha Rauschunterdrücker
DE10120168A1 (de) * 2001-04-18 2002-10-24 Deutsche Telekom Ag Verfahren zur Bestimmung von Intensitätskennwerten von Hintergrundgeräuschen in Sprachpausen von Sprachsignalen
US20040148166A1 (en) * 2001-06-22 2004-07-29 Huimin Zheng Noise-stripping device
US7092877B2 (en) * 2001-07-31 2006-08-15 Turk & Turk Electric Gmbh Method for suppressing noise as well as a method for recognizing voice signals
DE10150519B4 (de) * 2001-10-12 2014-01-09 Hewlett-Packard Development Co., L.P. Verfahren und Anordnung zur Sprachverarbeitung
US7103541B2 (en) * 2002-06-27 2006-09-05 Microsoft Corporation Microphone array signal enhancement using mixture models
US7283956B2 (en) * 2002-09-18 2007-10-16 Motorola, Inc. Noise suppression
DE10251603A1 (de) * 2002-11-06 2004-05-19 Dr.Ing.H.C. F. Porsche Ag Verfahren zur Störgeräuschunterdrückung
JP4336759B2 (ja) * 2002-12-17 2009-09-30 日本電気株式会社 光分散フィルタ
US20040148160A1 (en) * 2003-01-23 2004-07-29 Tenkasi Ramabadran Method and apparatus for noise suppression within a distributed speech recognition system
US7725315B2 (en) * 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
JP4583781B2 (ja) * 2003-06-12 2010-11-17 アルパイン株式会社 音声補正装置
TWI233590B (en) * 2003-09-26 2005-06-01 Ind Tech Res Inst Energy feature extraction method for noisy speech recognition
EP1683134B1 (de) * 2003-11-12 2010-06-23 Telecom Italia S.p.A. Verfahren und schaltung zur rauschschätzung, darauf bezogener filter, dieses benutzendes endgerät und kommunikationsnetzwerk, sowie computer-programm-produkt hierfür
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
JP4520732B2 (ja) * 2003-12-03 2010-08-11 富士通株式会社 雑音低減装置、および低減方法
JP4490090B2 (ja) * 2003-12-25 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
JP4601970B2 (ja) * 2004-01-28 2010-12-22 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
US7813921B2 (en) * 2004-03-31 2010-10-12 Pioneer Corporation Speech recognition device and speech recognition method
US7516069B2 (en) * 2004-04-13 2009-04-07 Texas Instruments Incorporated Middle-end solution to robust speech recognition
US7492889B2 (en) * 2004-04-23 2009-02-17 Acoustic Technologies, Inc. Noise suppression based on bark band wiener filtering and modified doblinger noise estimate
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US7949520B2 (en) * 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US7610196B2 (en) * 2004-10-26 2009-10-27 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US7680652B2 (en) 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8543390B2 (en) * 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
KR100716984B1 (ko) * 2004-10-26 2007-05-14 삼성전자주식회사 복수 채널 오디오 신호의 잡음 제거 방법 및 장치
US7716046B2 (en) * 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US8077815B1 (en) * 2004-11-16 2011-12-13 Adobe Systems Incorporated System and method for processing multi-channel digital audio signals
US8284947B2 (en) * 2004-12-01 2012-10-09 Qnx Software Systems Limited Reverberation estimation and suppression system
EP1681670A1 (de) * 2005-01-14 2006-07-19 Dialog Semiconductor GmbH Sprachaktivierung
US20060184363A1 (en) * 2005-02-17 2006-08-17 Mccree Alan Noise suppression
US8027833B2 (en) * 2005-05-09 2011-09-27 Qnx Software Systems Co. System for suppressing passing tire hiss
US7596231B2 (en) * 2005-05-23 2009-09-29 Hewlett-Packard Development Company, L.P. Reducing noise in an audio signal
US8311819B2 (en) 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
US8170875B2 (en) 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
US7366658B2 (en) * 2005-12-09 2008-04-29 Texas Instruments Incorporated Noise pre-processor for enhanced variable rate speech codec
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
KR100667852B1 (ko) * 2006-01-13 2007-01-11 삼성전자주식회사 휴대용 레코더 기기의 잡음 제거 장치 및 그 방법
US8194880B2 (en) * 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US7844453B2 (en) 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US10811026B2 (en) * 2006-07-03 2020-10-20 Nec Corporation Noise suppression method, device, and program
CN101193384B (zh) * 2006-11-20 2011-11-30 鸿富锦精密工业(深圳)有限公司 通过模式识别滤除环境音的方法及手机
US8335685B2 (en) 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US7912567B2 (en) * 2007-03-07 2011-03-22 Audiocodes Ltd. Noise suppressor
US20080231557A1 (en) * 2007-03-20 2008-09-25 Leadis Technology, Inc. Emission control in aged active matrix oled display using voltage ratio or current ratio
US7873114B2 (en) * 2007-03-29 2011-01-18 Motorola Mobility, Inc. Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8904400B2 (en) * 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
ATE501506T1 (de) * 2007-09-12 2011-03-15 Dolby Lab Licensing Corp Spracherweiterung mit anpassung von geräuschpegelschätzungen
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
TW200922272A (en) * 2007-11-06 2009-05-16 High Tech Comp Corp Automobile noise suppression system and method thereof
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) * 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8209514B2 (en) * 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8355908B2 (en) * 2008-03-24 2013-01-15 JVC Kenwood Corporation Audio signal processing device for noise reduction and audio enhancement, and method for the same
US8645129B2 (en) * 2008-05-12 2014-02-04 Broadcom Corporation Integrated speech intelligibility enhancement system and acoustic echo canceller
US9197181B2 (en) * 2008-05-12 2015-11-24 Broadcom Corporation Loudness enhancement system and method
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US8285545B2 (en) * 2008-10-03 2012-10-09 Volkswagen Ag Voice command acquisition system and method
JP2010122617A (ja) * 2008-11-21 2010-06-03 Yamaha Corp ノイズゲート、及び収音装置
CN101625870B (zh) * 2009-08-06 2011-07-27 杭州华三通信技术有限公司 Ans方法和装置、提高监控***音频质量的方法和***
KR101732208B1 (ko) * 2009-10-09 2017-05-02 디티에스, 인코포레이티드 오디오 녹음의 적응적 동적 범위 강화
EP2486567A1 (de) * 2009-10-09 2012-08-15 Dolby Laboratories Licensing Corporation Automatische erzeugung von metadaten für audiodominanzeffekte
EP2526445B1 (de) * 2010-01-19 2021-01-13 ION Geophysical Corporation Geräuschunterdrückungssystem mit zwei sensoren für ein unterwasserkabel
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
JP5609157B2 (ja) * 2010-02-26 2014-10-22 ヤマハ株式会社 係数設定装置および雑音抑圧装置
US9344823B2 (en) 2010-03-22 2016-05-17 Aliphcom Pipe calibration device for calibration of omnidirectional microphones
US8737654B2 (en) * 2010-04-12 2014-05-27 Starkey Laboratories, Inc. Methods and apparatus for improved noise reduction for hearing assistance devices
US8606571B1 (en) * 2010-04-19 2013-12-10 Audience, Inc. Spatial selectivity noise reduction tradeoff for multi-microphone systems
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9099077B2 (en) 2010-06-04 2015-08-04 Apple Inc. Active noise cancellation decisions using a degraded reference
US8515089B2 (en) 2010-06-04 2013-08-20 Apple Inc. Active noise cancellation decisions in a portable audio device
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP2012058358A (ja) * 2010-09-07 2012-03-22 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
US20120076320A1 (en) * 2010-09-28 2012-03-29 Bose Corporation Fine/Coarse Gain Adjustment
US8798278B2 (en) * 2010-09-28 2014-08-05 Bose Corporation Dynamic gain adjustment based on signal to ambient noise level
US8923522B2 (en) * 2010-09-28 2014-12-30 Bose Corporation Noise level estimator
US9280982B1 (en) 2011-03-29 2016-03-08 Google Technology Holdings LLC Nonstationary noise estimator (NNSE)
US9666206B2 (en) * 2011-08-24 2017-05-30 Texas Instruments Incorporated Method, system and computer program product for attenuating noise in multiple time frames
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US20180317019A1 (en) 2013-05-23 2018-11-01 Knowles Electronics, Llc Acoustic activity detecting microphone
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
EP3719801B1 (de) * 2013-12-19 2023-02-01 Telefonaktiebolaget LM Ericsson (publ) Schätzung von hintergrundrauschen bei audiosignalen
JP6361271B2 (ja) * 2014-05-09 2018-07-25 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
CN107112012B (zh) 2015-01-07 2020-11-20 美商楼氏电子有限公司 用于音频处理的方法和***及计算机可读存储介质
GB2558529A (en) * 2016-09-11 2018-07-18 Continental automotive systems inc Dynamically increased noise suppression based on input noise characteristics
CN109903775B (zh) * 2017-12-07 2020-09-25 北京雷石天地电子技术有限公司 一种音频爆音检测方法和装置
US10681458B2 (en) 2018-06-11 2020-06-09 Cirrus Logic, Inc. Techniques for howling detection
US10861484B2 (en) * 2018-12-10 2020-12-08 Cirrus Logic, Inc. Methods and systems for speech detection
CN117280416A (zh) * 2021-03-08 2023-12-22 弗劳恩霍夫应用研究促进协会 用于自适应背景音频增益平滑的装置和方法
CN113132882B (zh) * 2021-04-16 2022-10-28 深圳木芯科技有限公司 多动态范围压扩方法和***
US20210318850A1 (en) * 2021-06-25 2021-10-14 Intel Corporation Apparatus, systems, and methods for microphone gain control for electronic user devices

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3403224A (en) * 1965-05-28 1968-09-24 Bell Telephone Labor Inc Processing of communications signals to reduce effects of noise
JPS5640403B1 (de) * 1971-02-10 1981-09-21
US3803357A (en) * 1971-06-30 1974-04-09 J Sacks Noise filter
US3988679A (en) * 1973-05-04 1976-10-26 General Electric Company Wideband receiving system including multi-channel filter for eliminating narrowband interference
US4185168A (en) * 1976-05-04 1980-01-22 Causey G Donald Method and means for adaptively filtering near-stationary noise from an information bearing signal
US4025721A (en) * 1976-05-04 1977-05-24 Biocommunications Research Corporation Method of and means for adaptively filtering near-stationary noise from speech
US4110784A (en) * 1976-08-30 1978-08-29 Rca Corporation Noise reduction apparatus
US4325068A (en) * 1978-06-26 1982-04-13 Sanders Associates, Inc. Loran-C signal processor
US4270223A (en) * 1978-12-11 1981-05-26 Rockwell International Corporation Signal normalizer
US4287475A (en) * 1979-10-05 1981-09-01 The United States Of America As Represented By The Secretary Of The Air Force Circuit for the adaptive suppression of narrow band interference
NL8402320A (nl) * 1984-07-23 1986-02-17 Philips Nv Storingsdetektor.
US4635217A (en) * 1984-10-09 1987-01-06 Gte Government Systems Corporation Noise threshold estimator for multichannel signal processing
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system

Also Published As

Publication number Publication date
JP2995737B2 (ja) 1999-12-27
EP0380563A1 (de) 1990-08-08
EP0380563B1 (de) 1998-12-09
KR970000789B1 (ko) 1997-01-20
JPH03500347A (ja) 1991-01-24
EP0380563A4 (en) 1991-04-03
US4811404A (en) 1989-03-07
KR890702356A (ko) 1989-12-23
DE3856280D1 (de) 1999-01-21
WO1989003141A1 (en) 1989-04-06

Similar Documents

Publication Publication Date Title
DE3856280T2 (de) Rauschunterdrückungssystem
DE60131639T2 (de) Vorrichtungen und Verfahren zur Bestimmung von Leistungswerten für die Geräuschunterdrückung für ein Sprachkommunikationssystem
DE3689035T2 (de) Rauschminderungssystem.
DE69419615T2 (de) Sprachaktivitaetsdetektor
DE69630580T2 (de) Rauschunterdrücker und Verfahren zur Unterdrückung des Hintergrundrauschens in einem verrauschten Sprachsignal und eine Mobilstation
DE69428119T2 (de) Verringerung des hintergrundrauschens zur sprachverbesserung
DE69535709T2 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate bei einem Vokoder mit variabler Rate
DE68929442T2 (de) Vorrichtung zur Erfassung von Sprachlauten
DE60027438T2 (de) Verbesserung eines verrauschten akustischen signals
DE69617069T2 (de) Verfahren und Vorrichtung zur Geräuschverminderung
DE112009000805B4 (de) Rauschreduktion
DE69420027T2 (de) Rauschverminderung
DE69526007T2 (de) Postfilter und Verfahren zur Postfilterung
DE69421792T2 (de) Verfahren und Vorrichtung zur Geräuschreduzierung sowie Telefon
DE60009206T2 (de) Rauschunterdrückung mittels spektraler Subtraktion
DE3752288T2 (de) Sprachprozessor
DE69531710T2 (de) Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen
DE69816610T2 (de) Verfahren und vorrichtung zur rauschverminderung, insbesondere bei hörhilfegeräten
DE602004008455T2 (de) Verfahren, vorrichtung und computerprogramm zur berechung und einstellung der wahrgenommenen lautstärke eines audiosignals
DE10041512B4 (de) Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE60032797T2 (de) Geräuschunterdrückung
DE69830721T2 (de) Verfahren und vorrichtung zur bestimmung der übertragungsrate in einem kommunikationssystem
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
DE19715126C2 (de) Sprachsignal-Codiervorrichtung
EP1103956B1 (de) Exponentielle Echo- und Geräuschabsenkung in Sprachpausen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Free format text: SCHUMACHER & WILLSAU, PATENTANWALTSSOZIETAET, 80335 MUENCHEN