DE60108752T2 - Verfahren zur rauschunterdrückung in einem adaptiven strahlformer - Google Patents

Verfahren zur rauschunterdrückung in einem adaptiven strahlformer Download PDF

Info

Publication number
DE60108752T2
DE60108752T2 DE60108752T DE60108752T DE60108752T2 DE 60108752 T2 DE60108752 T2 DE 60108752T2 DE 60108752 T DE60108752 T DE 60108752T DE 60108752 T DE60108752 T DE 60108752T DE 60108752 T2 DE60108752 T2 DE 60108752T2
Authority
DE
Germany
Prior art keywords
noisy
noise
input signals
estimate
arrangement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60108752T
Other languages
English (en)
Other versions
DE60108752D1 (de
Inventor
J. Harm BELT
P. Cornelis JANSE
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of DE60108752D1 publication Critical patent/DE60108752D1/de
Application granted granted Critical
Publication of DE60108752T2 publication Critical patent/DE60108752T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Noise Elimination (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf ein Verfahren zur Rauschunterdrückung, wobei rauschbehaftete Eingangssignale in einer Audioverarbeitungsanordnung mit mehreren Eingängen Anpassungen ausgesetzt und summiert werden.
  • Die vorliegende Erfindung bezieht sich ebenfalls auf eine Audioverarbeitungsanordnung, welche die nachfolgenden Elemente umfasst: viele rauschbehaftete Eingänge, eine Anpassungsanordnung, die mit den vielen rauschbehafteten Eingängen gekoppelt ist, und eine Summieranordnung, die mit der Anpassungsanordnung gekoppelt ist, und einen Audioprozessor; sowie auf eine Kommunikationsanordnung mit einer Audioverarbeitungsanordnung.
  • Ein derartiges Verfahren und eine derartige Anordnung sind aus US-A-5.602.962 bekannt. Die bekannte Anordnung ist eine Sprachverarbeitungsanordnung, von der zwei oder mehr Eingänge mit Mikrophonen verbunden sind und wobei die Anordnung eine Summieranordnung zum Summieren der verarbeiteten Eingangssignale aufweist. Die digitalisierten Eingangssignale liefern eine Kombination von Sprach- und Rauschsignalen zu einer adaptiven Anordnung in Form steuerbarer Multiplizierer, die eine Gewichtung mit betreffenden Gewichtsfaktoren schaffen. Ein Bewertungsprozessor bewertet die Mikrophoneingangssignale und passt die Gewichtsfaktoren oder die Frequenzdomänenkoeffizienten konstant an zur Steigerung des Störabstandes des summierten Signals. Für den Fall einer zeitvariablen und nicht statischen Rauschsignalstatistik, wobei Rauschstandardabweichungen nicht etwa zeitunabhängig sind, werden die Gewichtsfaktoren konstant neu berechnet und zurückgesetzt, wobei nachher der Effekt auf die Eingangssignale berechnet und das summierte Signal berechnet werden. Dies allein führt zu einer sehr beträchtlichen Anzahl Berechnungen, die von dem Bewertungsprozessor durchgeführt werden müssen. Insbesondere im Falle von Fast Fourier Transformation (FFT) werden Berechnungen für jedes Eingangssignal gemacht, wobei außerdem der Spektrumbereich jedes Eingangssignals in verschiedene Teile aufgeteilt wird, wobei jeder Teil im Allgemeinen eine komplexe Anzahl mit einem reellen Teil und einem imaginären Teil hat, die beide separat berechnet werden müssen, wobei die Anzahl erforderlicher Echtzeit-Berechnungen riesig ansteigt. Dies bringt die erwünschte Rechenleistung heutiger preisgünstiger Prozessoren über ihre machbaren Grenzen.
  • Deswegen ist es u. a. eine Aufgabe der vorliegenden Erfindung, ein Verfahren, eine Audioverarbeitungsanordnung und eine Kommunikationsanordnung zu schaffen, die imstande sind, eine Rauschbewertung in einer Anordnung mit mehreren Eingängen durchzuführen ohne zuviel Berechnungen und wobei dazu eine Hochgeschwindigkeitsverarbeitung erforderlich ist.
  • Dazu weist das Verfahren nach der vorliegenden Erfindung das Kennzeichen auf, dass jede Schätzung eines Rauschfrequenzanteils der rauschbehafteten Signale einzeln berechnet wird, wobei Folgendes verwendet wird:
    • – die Summe der angepassten rauschbehafteten Eingangssignale,
    • – den Koeffizienten, verwendet zur Anpassung des einzelnen rauschbehafteten Eingangssignals, und
    • – eine vorhergehende Schätzung, gemacht für dieses Eingangssignal.
  • Auf entsprechende Weise weist die Audioverarbeitungsanordnung nach der vorliegenden Erfindung das Kennzeichen auf, dass der Audioprozessor, der mit der Anpassungsanordnung und mit der Summieranordnung gekoppelt ist, ausgerüstet ist zum einzelnen Berechnen jeder Schätzung eines Rauschfrequenzanteils der rauschbehafteten Eingangssignale, wobei Folgendes verwendet wird:
    • – die Summe der angepassten rauschbehafteten Eingangssignale,
    • – den Koeffizienten, verwendet zur Anpassung des einzelnen rauschbehafteten Eingangssignals, und
    • – eine vorhergehende Schätzung, gemacht für dieses Eingangssignal.
  • Es sei bemerkt, dass das US Patent US-A-5.574.824 einen Mikrophonanordnungssprachverstärker beschreibt, der eine variable Signalverzerrung ermöglicht. Der Verstärker verzögert die empfangenen Signale, so dass die erwünschten Signalanteile kohärent addieren, filtert jedes der verzögerten Signale über eine Analysenfilterbank, summiert die entsprechenden Kanalausgänge von den Sensoren, wendet auf die Kanalausgänge eine Verstärkungsfunktion an und kombiniert die gewichteten Kanalausgänge unter Verwendung eines Synthesenfilters. Die mittlere Rauschgröße für jeden Kanal kann verwendet werden zum Berechnen einer kanalabhängigen Verstärkung.
  • Es ist ein Vorteil des Verfahrens und der Audioverarbeitungsanordnung nach der vorliegenden Erfindung, dass die Anzahl simultan erforderlicher Berechnungen reduziert werden kann, da aus dem summierenden Ausgangssignal und den einzelnen An passungen die Rauschfrequenzanteile aller rauschbehafteten Eingangssignale geschätzt werden können. Diese Technik kombiniert adaptive, sog. Strahlformung mit vereinzelter Rauschbestimmung und ist insbesondere gemeint für Rauschunterdrückungsanwendungen in Audioverarbeitungsanordnungen oder Kommunikationsanordnungen und -systemen. Applikationen können nun mit reduzierten Rechenleistungsanforderungen einfacher implementiert werden, und zwar überall wo rauschbehaftete und echobehaftete Sprache verstärkt wird unter Verwendung mehrerer Audiosignale oder Mikrophone. Beispiele lassen sich finden in Audiofunksystemen, Audio- und/oder Videokonferenzsystemen, Sprachverstärkung, wie in Telefonsystemen, wie Mobiltelefonsystemen, und Spracherkennungssystemen, Sprecherbeglaubigungssystemen, Sprachcodierern und dergleichen.
  • Auf vorteilhafte Weise weist eine andere Ausführungsform des Verfahrens nach der vorliegenden Erfindung das Kennzeichen auf, dass die Anpassungen sich auf Filterung und Gewichtung der rauschbehafteten Eingangssignale beziehen.
  • Wenn die Anpassungen Filterung betreffen, werden die rauschbehafteten Eingangssignale gefiltert, wie beispielsweise mit Finite Impulse Response (FIR) Filtern. In dem Fall spricht man von einem "gefilterte Summe Strahlformer" (Filtered Sum Beamformer FSB), während in einem "gewichtete Summe Strahlformer" (Weighted Sum Beamformer (WSB) die Filter durch reelle Verstärkungen oder Dämpfungen ersetzt sind.
  • Eine andere Ausführungsform des Verfahrens nach der vorliegenden Erfindung weist das Kennzeichen auf, dass jeder geschätzte Rauschfrequenzanteil mit einer vorhergehenden Schätzung des genannten Rauschfrequenzanteils und mit einem Korrekturterm relatiert ist, der abhängig ist von den Anpassungen, die an den rauschbehafteten Eingangssignalen durchgeführt worden sind.
  • Auf vorteilhafte Weise wird für jedes Eingangssignal einzeln die jüngste Schätzung eines betreffenden Eingangsrauschanteils in einem Frequenzgebiet oder Speicher des Frequenzspektrums vorübergehend zur späteren Verwendung durch eine Aktualisierungsbeziehung gespeichert zum Veröffentlichen eines aktualisierten und genau verfügbaren Rauschanteils.
  • Nach eine andere Ausführungsform des Verfahrens nach der vorliegenden Erfindung weist das Kennzeichen auf, dass die Schätzung der Rauschfrequenzanteile der betreffenden Eingangssignale in den summierten Eingangssignalen von der Detektion eines Audiosignals in dem betreffenden Eingangssignal abhängig gemacht werden kann.
  • Bei dieser Ausführungsform wird die Schätzung von der Detektion eines Audiosignals, wie eines Sprachsignals, abhängig gemacht. Wenn Sprache detektiert wird, basiert die Schätzung rauschbehafteter Frequenzanteile auf dem vorhergehenden nicht aktualisierten Rauschfrequenzanteil. Wenn keine Sprache detektiert wird, und in dem betreffenden Eingangssignal nur Rauschanteile vorhanden sind, basiert die Schätzung der Rauschfrequenzanteile auf einem aktualisierten vorhergehenden Rauschfrequenzanteil.
  • Eine folgende Ausführungsform des Verfahrens nach der vorliegenden Erfindung weist das Kennzeichen auf, dass das Verfahren spektrale subtraktionsartige Techniken anwendet um Rauschanteile zu unterdrücken.
  • Spektrale Subtraktion wird vorzugsweise dann angewandt, wenn Rauschreduktion erwogen wird, wie in sprachrelatierten Applikationen.
  • Ausführungsbeispiele der Erfindung sind in der Zeichnung dargestellt und werden im vorliegenden Fall näher beschrieben. Es zeigen:
  • 1 ein bekanntes Diagramm zur Erläuterung des Verfahrens und der Audioverarbeitungsanordnung nach der vorliegenden Erfindung zur Anwendung von Rauschunterdrückung,
  • 2 einen sog. Strahlformer zur Anwendung in der Audioverarbeitungsanordnung nach der vorliegenden Erfindung,
  • 3a und 3b Rauschschätzungsdiagramme zum Implementieren in dem Audioprozessor zur Anwendung in der Audioverarbeitungsanordnung nach der vorliegenden Erfindung mit bzw. ohne Sprachdetektion, und
  • 4 eine Ausführungsform eines Rauschspektrumschätzers zur Anwendung in den betreffenden Diagrammen nach 3a und 3b.
  • 1 zeigt ein Diagramm zur Erläuterung von Rauschunterdrückung mit Hilfe von spektraler Subtraktion. Digitalisierte rauschbehaftete Eingangssignale bei IN werden zunächst von seriellen Daten in parallele Daten in einem Wandler S/P umgewandelt, in einem Zeitfenster "gefenstert" und danach durch spektrale Transformation, wie eine diskrete Fourier-Transformation (DFR) zerlegt. Nach der spektralen Zeitdekomposition wird die nicht geänderte Phaseninformation einer spektralen Rekonstruktionsanordnung zugeführt zum Anwenden einer inversen DFT und danach in dem Wandler P/S von parallelen Daten in serielle Daten umgewandelt. Größeninformation wird einem Rauschwertschätzer 1 zugeführt. Ein Subtrahierer oder mehr allgemein eine Verstärkungsfunktion empfängt ein Ausgangssignal des Rauschwertschätzers, das für den geschätzten Rauschwert in dem Eingangssignal IN repräsentativ ist, zusammen mit dem Größeninformationssignal, das die Größe der Frequenzanteile des rauschbehafteten Eingangssignals IN darstellt. Die beiden werden spektral subtrahiert zum Offenlegen eines rauschkorrigierten Größeninformationssignals, das der spektralen Zeitrekonstruktionsanordnung zugeführt wird. Die oben genannte spektrale Subtraktionstechnik kann auf ein Eingangssignal zum Unterdrücken von darin gebundenen Rauschwerten. Dabei handelt es sich um Rauschwerte, deren Statistiken sich nicht wesentlich ändern als eine Funktion der Zeit. Es gibt viele spektrale subtraktionsähnliche Techniken. Bekannte Techniken lassen sich finden in dem Artikel: "Speech Enhancement Based on A Priori Signal to Noise Estimation", "IEEE ICASSP-96", Seiten 629–632 von P. Scalart und J. V. Filho.
  • 2 zeigt einen sog. Strahlformer-Eingangsteil zur Anwendung in einer Audioverarbeitungsanordnung 2. Die Audioverarbeitungsanordnung 2 umfasst mehrere rauschbehaftete Eingänge u1, u2, ... uM, und eine Anpassungsanordnung 3, die mit den vielen rauschbehafteten Eingängen u1, u2, ... uM gekoppelt sind. Eine Summieranordnung 4 der Anpassungsanordnung 3 summiert die angepassten rauschbehafteten Eingänge und ist mit einem Audioprozessor 5 gekoppelt, der das allgemeine Rauschunterdrückungsdiagramm nach 1 implementiert. Die Eingänge können Mikrophoneingänge sein. Die Anpassungsanordnung 3 kann als gefilterte Summe Strahlformer (FSB) (Filtered-Sum Beamformer) mit Filterimpulsantworten f1, f2, ... fM oder als gewichtete Summe Strahlformer (WSB) (Weighted-Sum Beamformer) ausgebildet sein, dessen Filter durch reelle Verstärkungen w1, w2, ... wM ersetzt sind. Diese Antworten und Verstärkungen der Strahlforderkoeffizienten werden ständig Anpassungen ausgesetzt, d.h. Änderungen in der Zeit. Die Anpassungen können beispielsweise zum Fokussieren auf eine andere Lage des Sprechers, wie dies aus EP-A-0954850 bekannt ist. Summierung führt zu einem summierten Ausgangssignal der Summieranordnung 4 mit summierten Rauschwerten der summierten Eingangssignale wobei diese summierten Ausgangsrauschwerte nicht gebunden sind. Das betreffende Problem dabei ist nun, wie die in den einzelnen Eingangssignalen u1, u2, ... uM vorhandenen Rauschanteile von summierten Rauschabteilen, die an dem Ausgang der Summieranordnung 4 vorhanden sind, geschätzt werden sollen, wobei die Kombination der spektralen Subtraktion nach 1 und der Strahlformer nach 2 verwendet werden.
  • Man könnte die gebundenen Rauschgrößenspektren an den Eingängen des adaptiven Strahlformers schätzen und das (nicht gebundene) Rauschgrößenspektrum an dem Ausgang der Summieranordnung berechnen, und zwar unter Verwendung der aktuellen Strahlformerkoeffizientenwerte. Dies aber ist kostspielig, und zwar wegen der aufwendigen M spektralen Transformationen, erforderlich für jedes Strahlformereingangssignal u1, u2, ... uM.
  • Die 3a und 3b zeigen Rauschschätzerdiagramme, die in dem im Allgemeinen programmierbaren Audioprozessor 5 implementiert werden sollen zur Anwendung in der vorliegenden Audioverarbeitungsanordnung 2 mit mehreren Eingängen, mit bzw. ohne Sprachdetektion. 4 zeigt eine Ausführungsform eines Rauschspektrumschätzers 6 zur Anwendung in den betreffenden Diagrammen nach 3a und 3b. Es sei bemerkt, dass in diesem Fall nur eine spektrale Transformation durchgeführt werden soll, statt der oben genannten M spektralen Transformationen.
  • Wenn die Audioverarbeitungsanordnung 2 mit einem Audio- oder Sprachdetektor versehen ist, der einen Schalter 7 hat, kann 3a angewandt werden. Darin ist Pin(k; lB) eine Zahl, welche die Größe eines Frequenzanteils k in einem aufgeteilten spektralen Frequenzbereich des Ausgangssignals der Summieranordnung 4 angibt und lB stellt einen Block oder einen Wiederholungsindex dar. Das tief gestellte B bezeichnet die Datenblockgröße, wobei die Strahlformerfrequenzkoeffizienten Fm(k; lB) (mit m = 1 ... M) einmal je B Abtastwerte aktualisieret und geändert werden. Wenn keine Sprache detektiert wird, befindet sich der Schalter 7 in der Oben-Lage in 3a und umgekehrt. In der Oben-Lage des Schalters 7 wird dem Rauschspektrumschätzer 6 nach 4 ein Aktualisierungsterm δ(k; lB) zugeführt. Der Schätzer G leitet davon auf eine nachstehend noch zu erläuternde Art und Weise ein aktualisiertes, geschätztes Ausgangsspektrum Ϸ(k; lB) der Rauschgrößensummierungsanordnung 4 her. Z–1 stellt ein Z-Transformationsverzögerungselement dar. Auf diese Weise kann hergeleitet werden, dass wenn keine Sprache detektiert wird, eine Aktualisierung nach der folgenden Gleichung stattfindet: Ϸ(k; lB) = NS{(1 – α)[Pin(k; lB) – Ϸ(k; lB-1)]}wobei α ein Speicherparameter und NS eine Funktion ist, die das Verhalten des Rauschspektrumschätzers 6 darstellt.
  • 4 zeigt eine Ausführungsform des Rauschspektrumschätzers 6 zur Anwendung in den Rauschschäterdiagrammen nach den 3a bzw. 3b. Der Schätzer 6 hat ebenso viele Zweige 1 bis M wie es Eingangssignale M gibt. Die Ausgangssignale der Zweige werden in einem Addierer 8 addiert.
  • Dabei gilt, dass:
    Figure 00070001
    und dass: Ϸm(k; lB) = max[Ϸm(k; lB) + δ(k; lB)μ(k; lB)|Fm(k; lB)|,c]wobei für alle k, m = 1 ... M, μ(k; lB) die Anpassungsschrittgröße ist. Auf diese Weise gibt es keine Aktualisierungen kleiner als c (wobei c eine kleine nicht negative Konstante ist) und für jedes Eingangssignal um wird eine vorhergehende Schätzung des wirklichen Spektrums Ϸm(k; lB) in dem Verzögerungselement Z–1 zur späteren Verwendung derselben gespeichert. Dadurch liefert jedes Zweigausgangssignal Information über die Rauschcharakteristiken jedes einzelnen Eingangssignals ohne dass dazu außergewöhnliche Frequenztransformationsberechnungen erforderlich sind. In der Unten-Lage des Schalters 7 schafft in dem Fall, dass Sprache detektiert wird, der Rauschspektrumschätzer 6 die jüngste wirkliche Rauschschätzung für Rauschunterdrückungszwecke.
  • 3b zeigt die Situation in dem Fall, dass es keinen Sprachdetektor gibt. Die Ausführungsform nach 3b verlässt sich auf eine Rekursion, die bei allen 1B Abtastwerten aufkommt und wobei dieses Schema für jede Frequenzbin k wiederholt wird. In dem Block 9 wird das Signalgrößenspektrum tiefpassgefiltert, und zwar entsprechend: Ps(k; lB) = α(lB)Ps(k; lB) + (1 – α(1B))Pin(k; lB)
  • Für alle k. Der Speicherparameter α(1B) wird gewählt entsprechend: α(1B) = αup wenn Pin(k; lB) ≥ Ps(k; lB) sonst α(1B) = αdown
  • Hier ist αup eine Konstante entsprechend einem langen Speicher (0 << αup < 1) und αdown ist eine Konstante entsprechend einem kurzen Speicher (0 < αdown << 1). Auf diese Weise bevorzugt die Rekursion "abwärts" gegenüber "aufwärts", so dass im Endeffekt ein Minimum erzielt wird. Im Allgemeinen wird die Schrittgröße μ(k; lB) in dem FSB-Fall wie folgt gewählt:
    Figure 00070002
    und in dem WSB-Fall derart, dass:
    Figure 00080001
    was zu μ = 1 reduziert werden kann, wenn bestimmte adaptive Algorithmen verwendet werden, welche die Eigenschaft haben, dass die Nenner der zwei oben stehenden Ausdrücke gleich 1 sind, wie in EP-A-0954850 beschrieben. Der Schätzungsaktualisierungsterm δ(k; lB) wird gewählt entsprechend:
    wenn Ps(k; lB) ≥ Ϸ(k; lB-1) ist, dann (Bedingung ist wahr) δ(k; lB) = {q(lB) – 1}Ϸ(k; lB-1); q(lB + 1) = q)lB) × INCFACTOR
  • Sonst (Bedingung ist nicht wahr) δ(k; lB) = Ps(k; lB) – Ϸ(k; lB-1); q(1B + 1) = INITVAL
  • Dabei kann man bei einer Abtastrate von 8 kHz mit den Datenblöcken B = 128, INCFACTOR = 1,0004 und INITVAL = 1,00025. Mit diesem Mechanismus wird Ϸ(k; lB-1) nur effektiv gesteigert, wenn das gemessene Spektrum Ps(k; lB) eine ausreichend lange Zeit größer ist, d.h. in Situationen, in denen der Rauschwert sich wirklich zu einer größeren Rauschleistung geändert hat.
  • Während Obenstehendes anhand wesentlich bevorzugter Ausführungsformen und den möglichst besten Moden beschrieben worden ist, dürfte es einleuchten, dass diese Ausführungsformen keineswegs als die betreffenden Anordnungen begrenzend betrachtet werden sollen, weil im Rahmen der beiliegenden Patentansprüche für den Fachmann viele Modifikationen, Merkmale und Kombinationen von Merkmalen möglich sind.
  • Text in der Zeichnung
  • 1
    • Zeitfenster
    • Spektrale Dekomposition
    • Rauschschätzer
    • Subtrahierer
    • Größe
    • Phase
    • Spektrale Zeitrekonstruktionsanordnung
  • Stand der Technik
  • 3a
    • Signalgröße
    • Keine Sprache detektiert
    • Sprache detektiert
    • Rauschspektrumschätzer
  • 3b
    • Signalgröße
    • Bedingung ist nicht wahr
    • Bedingung ist wahr
    • Rauschspektrumschätzer
  • 4
    • Rauschspektrumschätzer

Claims (8)

  1. Verfahren zur Rauschunterdrückung, wobei rauschbehaftete Eingangssignale (u1 ... uM) in einer Audioverarbeitungsanordnung (2) mit mehreren Eingängen Anpassungen ausgesetzt und summiert werden (4), dadurch gekennzeichnet, dass jede Schätzung (p^1(k; lB), ..., p^M(k; lB)) eines Rauschfrequenzanteils (p1(k; lB), ..., pM(k; lB)) der rauschbehafteten Signale (u1 ... uM) einzeln berechnet wird, wobei Folgendes verwendet wird: – die Summe der angepassten rauschbehafteten Eingangssignale, – den Koeffizienten (|Fm(k; lB)|), verwendet zur Anpassung des einzelnen rauschbehafteten Eingangssignals, und – eine vorhergehende Schätzung, gemacht für dieses Eingangssignal.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Anpassungen Filterung oder Gewichtung der rauschbehafteten Eingangssignale (u1 ... uM) betreffen.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass jede Schätzung (p^1(k; lB), ..., p^M(k; lB)) eines Rauschfrequenzanteils (p1(k; lB), ..., pM(k; lB)) bezogen ist auf eine vorhergehende Schätzung des genannten Rauschfrequenzanteils und auf einen Korrekturterm (δ(k; lB)μ|Fm(k; lB)|), der abhängig ist von den Anpassungen, durchgeführt an den rauschbehafteten Eingangssignalen (u1 ... uM).
  4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Schätzung der Rauschfrequenzanteile der betreffenden Eingangssignale in den Summierten Eingangssignalen abhängig gemacht werden kann von der Detektion eines Audiosignals in dem betreffenden Eingangssignal.
  5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass das Verfahren zur Rauschunterdrückung spektrale subtraktionsähnliche Techniken anwendet.
  6. Audioverarbeitungsanordnung (2), welche die nachfolgenden Elemente umfasst: viele rauschbehaftete Eingänge, eine Anpassungsanordnung (3), die mit den vielen rauschbehafteten Eingängen (u1 ... uM) gekoppelt ist und eine Summieranordnung (4) aufweist, und einen Audioprozessor (5), dadurch gekennzeichnet, dass der Audioprozessor (5), der mit der Anpassungsanordnung (3) und mit der Summieranordnung (4) gekoppelt ist, ausgerüstet ist zum einzelnen Berechnen jeder Schätzung (p^1(k; lB), ..., p^M(k; lB)) eines Rauschfrequenzanteils (p1(k; lB), ..., pM(k; lB)) der rauschbehafteten Eingangssignale (u1 ... uM), wobei Folgendes verwendet wird: – die Summe der angepassten rauschbehafteten Eingangssignale, – den Koeffizienten (|Fm(k; lB)|), verwendet zur Anpassung des einzelnen rauschbehafteten Eingangssignals, und – eine vorhergehende Schätzung, gemacht für dieses Eingangssignal.
  7. Audioverarbeitungsanordnung nach Anspruch 6, gekennzeichnet durch einen Audiodetektor, der mit dem Audioprozessor (5) gekoppelt ist.
  8. Kommunikationsanordnung mit einer Audioverarbeitungsanordnung (2) nach Anspruch 6 oder 7.
DE60108752T 2000-05-26 2001-05-03 Verfahren zur rauschunterdrückung in einem adaptiven strahlformer Expired - Fee Related DE60108752T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP00201879 2000-05-26
EP00201879 2000-05-26
PCT/EP2001/004999 WO2001091513A2 (en) 2000-05-26 2001-05-03 Method for noise suppression in an adaptive beamformer

Publications (2)

Publication Number Publication Date
DE60108752D1 DE60108752D1 (de) 2005-03-10
DE60108752T2 true DE60108752T2 (de) 2006-03-30

Family

ID=8171564

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60108752T Expired - Fee Related DE60108752T2 (de) 2000-05-26 2001-05-03 Verfahren zur rauschunterdrückung in einem adaptiven strahlformer

Country Status (6)

Country Link
US (1) US7031478B2 (de)
EP (1) EP1290912B1 (de)
JP (1) JP2003534570A (de)
AT (1) ATE288666T1 (de)
DE (1) DE60108752T2 (de)
WO (1) WO2001091513A2 (de)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1410382T3 (da) * 2001-06-28 2010-06-28 Oticon As Fremgangsmåde til støjreduktion i et høreapparat til implementering af en sådan fremgangsmåde
US20070076898A1 (en) * 2003-11-24 2007-04-05 Koninkiljke Phillips Electronics N.V. Adaptive beamformer with robustness against uncorrelated noise
US20070047742A1 (en) * 2005-08-26 2007-03-01 Step Communications Corporation, A Nevada Corporation Method and system for enhancing regional sensitivity noise discrimination
US7619563B2 (en) 2005-08-26 2009-11-17 Step Communications Corporation Beam former using phase difference enhancement
US7415372B2 (en) 2005-08-26 2008-08-19 Step Communications Corporation Method and apparatus for improving noise discrimination in multiple sensor pairs
US7436188B2 (en) 2005-08-26 2008-10-14 Step Communications Corporation System and method for improving time domain processed sensor signals
US7472041B2 (en) 2005-08-26 2008-12-30 Step Communications Corporation Method and apparatus for accommodating device and/or signal mismatch in a sensor array
US8345890B2 (en) * 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8194880B2 (en) * 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
CN101098179B (zh) * 2006-06-30 2010-06-30 中国科学院声学研究所 一种宽带频域数字波束形成方法
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US8363846B1 (en) * 2007-03-09 2013-01-29 National Semiconductor Corporation Frequency domain signal processor for close talking differential microphone array
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
WO2009028349A1 (ja) * 2007-08-27 2009-03-05 Nec Corporation 特定信号消去方法、特定信号消去装置、適応フィルタ係数更新方法、適応フィルタ係数更新装置及びコンピュータプログラム
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US20120020489A1 (en) * 2009-01-06 2012-01-26 Tomohiro Narita Noise canceller and noise cancellation program
JP5310494B2 (ja) * 2009-11-09 2013-10-09 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8666092B2 (en) * 2010-03-30 2014-03-04 Cambridge Silicon Radio Limited Noise estimation
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8239196B1 (en) * 2011-07-28 2012-08-07 Google Inc. System and method for multi-channel multi-feature speech/noise classification for noise suppression
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9078057B2 (en) * 2012-11-01 2015-07-07 Csr Technology Inc. Adaptive microphone beamforming
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
EP3122406B1 (de) 2014-03-25 2017-11-22 Koninklijke Philips N.V. Inhalator mit zwei mikrofonen zum nachweis des inhalationsflusses
WO2016033364A1 (en) 2014-08-28 2016-03-03 Audience, Inc. Multi-sourced noise suppression
CN109671433B (zh) * 2019-01-10 2023-06-16 腾讯科技(深圳)有限公司 一种关键词的检测方法以及相关装置
CN112017674B (zh) * 2020-08-04 2024-02-02 杭州联汇科技股份有限公司 一种基于音频特征检测广播音频信号中噪声的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4330243A1 (de) * 1993-09-07 1995-03-09 Philips Patentverwaltung Sprachverarbeitungseinrichtung
US5574824A (en) * 1994-04-11 1996-11-12 The United States Of America As Represented By The Secretary Of The Air Force Analysis/synthesis-based microphone array speech enhancer with variable signal distortion
JP4163294B2 (ja) * 1998-07-31 2008-10-08 株式会社東芝 雑音抑圧処理装置および雑音抑圧処理方法

Also Published As

Publication number Publication date
EP1290912A2 (de) 2003-03-12
US20020013695A1 (en) 2002-01-31
US7031478B2 (en) 2006-04-18
DE60108752D1 (de) 2005-03-10
WO2001091513A3 (en) 2002-05-16
EP1290912B1 (de) 2005-02-02
WO2001091513A2 (en) 2001-11-29
ATE288666T1 (de) 2005-02-15
JP2003534570A (ja) 2003-11-18

Similar Documents

Publication Publication Date Title
DE60108752T2 (de) Verfahren zur rauschunterdrückung in einem adaptiven strahlformer
DE112009001003B4 (de) Geräuschunterdrückungssystem mit zwei Mikrophonen
DE69822128T2 (de) Anordnung zur verarbeitung von audiosignalen aus mehreren quellen
DE10118653C2 (de) Verfahren zur Geräuschreduktion
DE69738288T2 (de) Einrichtung zur unterdrückung einer störenden komponente eines eingangssignals
DE102010055476B4 (de) Signalverarbeitungsgerät, Mikrofonarrayvorrichtung und Speichermedium, das ein Signalverarbeitungsprogramm speichert
DE102018127071B3 (de) Audiosignalverarbeitung mit akustischer Echounterdrückung
DE102006027673A1 (de) Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm
DE102010023615B4 (de) Signalverarbeitungsvorrichtung und Signalverarbeitungsverfahren
DE60029436T2 (de) Akustischer Echokompensator
WO2000019770A1 (de) Hörgerät und verfahren zum verarbeiten von mikrofonsignalen in einem hörgerät
DE112009000805T5 (de) Rauschreduktion
EP0948237A2 (de) Verfahren zur Störbefreiung eines Mikrophonsignals
EP1771034A2 (de) Mikrofonkalibrierung bei einem RGSC-Beamformer
EP3375204B1 (de) Audiosignalverarbeitung in einem fahrzeug
EP2182739A1 (de) Adaptives Mikrofonsystem für ein Hörgerät und zugehöriges Betriebsverfahren
EP3065417B1 (de) Verfahren zur unterdrückung eines störgeräusches in einem akustischen system
DE102018117557B4 (de) Adaptives nachfiltern
DE102018117558A1 (de) Adaptives nachfiltern
DE102005039621A1 (de) Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
EP2124482A2 (de) Hörvorrichtung mit einem Entzerrungsfilter im Filterbank-System
EP0615226B1 (de) Verfahren zur Geräuschreduktion für gestörte Sprachkanäle
EP1453355A1 (de) Signalverarbeitung in einem Hörgerät
DE102018117556B4 (de) Einzelkanal-rauschreduzierung
DE10140523B4 (de) Vorrichtung zum Feedback Cancelling bei der Ausgabe von Mikrofonsignalen durch Lautsprecher

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee