DE2207141C3 - Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters - Google Patents

Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters

Info

Publication number
DE2207141C3
DE2207141C3 DE2207141A DE2207141A DE2207141C3 DE 2207141 C3 DE2207141 C3 DE 2207141C3 DE 2207141 A DE2207141 A DE 2207141A DE 2207141 A DE2207141 A DE 2207141A DE 2207141 C3 DE2207141 C3 DE 2207141C3
Authority
DE
Germany
Prior art keywords
signal
speech
speech signal
circuit
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE2207141A
Other languages
English (en)
Other versions
DE2207141A1 (de
DE2207141B2 (de
Inventor
Olga Mary Mracek Summit N.J. Mitchell
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
Western Electric Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Western Electric Co Inc filed Critical Western Electric Co Inc
Publication of DE2207141A1 publication Critical patent/DE2207141A1/de
Publication of DE2207141B2 publication Critical patent/DE2207141B2/de
Application granted granted Critical
Publication of DE2207141C3 publication Critical patent/DE2207141C3/de
Expired legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/087Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using different frequency bands for transmitting and receiving paths ; using phase shifting arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

55
Die Erfindung betrifft eine Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters mit einer Anordnung zur Ableitung einer elektrischen Wellenform, die ein Sprachsignal repräsentier;, einer Anordnung zur Ableitung von Parametern eines Sprachsignals, die vom Sprachsignal während der Intervalle der Sprachgrundwellenperiode gesteuert wird und einer Anordnung, die auf die abgeleiteten Parameter für die Wiedergewinnung der elektrischen Wellenform anspricht.
Bei der Telefonie und anderen einschlägigen Gebieten kommt es häufiger vor, daß die Sprache einer Quelle, die ein Zuhörer zu hören wünscht, in ihrer Verständlichkeit ernsthaft durch die Sprache einer zweiten unerwünschten Quelle gestört wird. Zur Verringerung der Wirkungen der zweiten Sprachquelle wurden bereits zahlreiche Vorschläge gemacht Diese betreffen eine relative Verbesserung des erwünschten Spr?.chsignals, indem das unerwünschte Sprachsignal relativ unverständlich gehalten wird oder indem die Energie des unerwünschten Signals herabgesetz' wird. Unabhängig von der Art und Weise der Verbesserungen wurde als typisches Resultat erzielt, daß das gewünschte Sprachsignal nun verständlicher war, als es bei dem vollständigen Fehler, einer Sprachverarbeitung gewesen wäre. Die »Freihand«-Telefone sind Musterbeispiele für dieses Problem der gegenseitig in Konflikt geratenden Sprachquellen, da deren elektroakustischer Wandler (Lautsprecher) eine potentielle Quelle von unerwünschten Signalen am Mikrofon der gleichen Sprechstelle darstellen.
Die Aufgabe der vorliegenden Erfindung besteht nun darin, den genannten Nachteil der Störung eines gewünschten Sprachsignals durch ein unerwünschtes, insbesondere bei »Freihand«-Telefonen zu vermeiden.
Für eine Sprachverarbeitungseinrichtung der eingangs genannten Art wird diese Aufgabe dadurch gelöst, daß die Anordnung für die Ableitung der Parameter des Sprachsignals einen Verzögerungs- und Verstärkungsparameter unerwünschter Sprachsignalwerte (c) während eines Intervalls ableitet, das einen wesentlichen Teil der Grundwellenperiode des unerwünschten Sprachsignals umfaßt, welche Parameter dazu verwendet werden, das unerwünschte Sprachsignal wiederzugewinnen, und daß schließlich eine Kombinationsschaltung vorgesehen ist, die das wiedergewonnene, unerwünschte Sprachsignal mit einer Kombination (a + c) des unerwünschten und eines erwünschten (a) Sprachsignals kombiniert, so daß das gewünschte Sprachsignal übrig bleibt.
Eine weitere Ausgestaltung der Erfindung betrifft eine Schaltungsanordnung, bei der das unerwünschte Signal über eine ankommende Leitung in einer Empfängerstelle empfangen wird und die Kombinationsschaltung an eine abgehende Leitung für das Auslöschen ankommender Sprachsignale angeschlossen wird, die in Kombination mit dem abgehenden Signal vorliegen können.
Weitere, vorteilhafte Ausgestaltungen und Weiterbildungen des Gegenstandes der Erfindung sind den Unteransprüchen zu entnehmen.
Die Vorteile der Erfindung ergeben sich im wesentlichen aus der nachfolgenden Betrachtung:
Die Erfindung beruht auf der allgemeinen Erkenntnis, daß ein unerwünschtes Sprachsignal auf der Basis seiner Sprachparameter unterdrückt werden kann.
Der US-Patentschrift 36 31 520 sind bestimmte Sprachparameter zugrundegelegt. Ferner ist dort eine »vorhersagende Codierungs«-Technik für die Verringerung der Übertragungsbandbreite angegeben, in der eine Abschätzung des Augenblickswertes der Sprachsignalabtastung auf der Basis eines bekannten entsprechenden vorhergehenden Wertes vorgenommen wird. Aus diesen Daten wird ein Differenz- oder Fehlersignal erzeugt und zu einer fernen Empfangsstation zusammen mit bestimmten Vorhersage-Parametern übertragen. In der fernen Empfangsstation wird das gesamte Signal aus dem Fehlersignal, unter Verwendung der Vorhersage-Parameter, wieder neu gebildet.
Es wurde nun erkannt, daß der in der genannten US-Patentschrift angegebene Prozeß so umgestaltet
werden kann, daß er ein gegebenes, unerwünschtes Sprachsignal im wesentlichen eliminieren kann.
Das grundlegende Konzept der Erfindung besteht darin, aus dem unerwünschten Signal einen Verzögerungs- und einen Verstärkungs-Parametei· abzuleiten. Diese Parameter steuern ein Verzögerungs- und Verstärkungsnetzwerk, durch das sowohl die gewünschten als auch die unerwünschten Signale geleitet werden. Die Verzögerungszeit entspricht etwa der augenblicklichen Dauer der Grundwellenperiode des unerwünschten Sprachsignals. Die Verstärkung wird nach einer von mehreren möglichen Formeln errechnet, so daß so das verzögerte, unerwünschte Signal auf ein Amplituden-Niveau des vorliegenden Wertes des unerwünschten Sprachsignals gebracht wird. Alternativ hierzu wird bei einer technisch weniger komplexen Ausführung die Verstärkung gleich 1 gesetzt In jedem Falle wird das Ausgangssignal des Netzwerkes dann subtraktiv auf das unerwünschte Sprachsignal oder auf irgendeinem komponenten Signal angewandt, das das urerwünschte Sprachsignal enthält Dieses Verfahren kann entweder in analoger oder digitaler Technik durchgeführt werden.
Von Vorteil ist jedoch, wenn das Verfahren mit Hilfe einer Abtasttechnik durchgeführt wird, bei der das Signal mit einer Folgefrequenz von beispielsweise 6 kHz abgetastet wird, was bedeutet, daß je Grundwellenperiode 30 — 60 Abtastungen durchgeführt werden. Die Zahl der Abtastungen in einer Grundwellenperiode verändert sich mit der Frequenz der Sprachgrundwelle.
Bei einem Ausführungsbeispiel der Erfindung kann die Sprache aus dem Lautsprecher eines handfreien Fernsprechapparates, die entweder direkt oder als Nachhallreflektion auf das Mikrofon des Apparates auftrifft, weitgehend aus dem Ausgangssignal des Mikrofones entfernt werden. Es wird dabei sowohl das Nachhallsignal als auch das direkte Signal unterdrückt, da sich die unerwünschten Sprachparameter während des Sprechens nicht schnell verändern.
Bei einem anderen Ausführungsbeispiel der Erfindung wird beispielsweise die Sprache von zwei Sprechern von einer Mehrzahl von Mikrofonen festgestellt und die Sprache eines Sprechers unter Verwendung der festgestellten Sprachparameter durch die Kombination der Ausgangssignale der Mikrofone unterdrückt.
Es ist nun offensichtlich, daß die Umgestaltung des in der genannten US-Patentschrift aufgezeigten Verfahrens in einem Aspekt ein Filter darstellt, und zwar ein Filter mit kamipförmigem Frequenzspektrum, dessen Minima bei der Sprachgrundfrequenz (und deren Harmonische) des unerwünschten Sprachsignals liegen. Hierin unterscheidet sich das »vorhersagende« Filter der Erfindung von einer konventionellen Echosperre, die nur ein nachhallendes Signal spiegelt und diese Spiegelung von dem zusammengesetzten Signal, das aus dem Signal selbst und seiner Spiegelung besteht, subtrahiert.
Im folgenden wird die Erfindung anhand eines durch Zeichnungen erläuterten Ausführungsbeispieles näher beschrieben. Es zeigt
Fig. 1 das schematische Blockschaltbild eines Sprachübertragungsnetzwerks mit einem handfreien Telefon und der erfindungsgemäßen Anordnung,
Fig.2 ein schematisches Blockschaltbild des erfindungsgemäßen vorhersagenden Filters,
F i g. 3 ein schematisches Blockschaltbild zur weiteren Veranschaulichung der erfindungsgemäßen Vorhersageschaltung,
Fig.4—6 grafische Darstellungen verschiedener Kenniinien der Vorhersagcschaltung,
F i g. 7 u. 8 Darstellungen zweier weiterer Ausführungsbeispiele der Erfindung in einem Sprachübertragungsneizwerk mit handfreien Fernsprechapparaten und
Fig.9 u. 10 schematische Darstellungen der Erfindung für die Unterdrückung der Sprache mehrerer Sprecher in einem Raum.
ίο Bei dem ersten, in F i g. 1 dargestellten Ausführungsbeispiel der Erfindung ist ein handfreier Fernsprechapparat mit einem Lautsprecher 1 und einem Mikrofon 2 in einem nicht hallfreiem Raum 3 an eine Sprachverarbeitungseinrichtung 8 gemäß der Erfindung angeschlossen. Im allgemeinen kommt das gewünschte Sprachsignal als Eingangssignal für das Mikrofon 2 von der Sprachquelle 4, dem nahen Sprecher, dessen Signal a hauptsächlich den direkten Pfad 5 entlang wandert Die Schallreflexic ι der Quelle 4 ist in Fig. 1 nicht dargestellt L?r Lautsprecher 1, der das Signal des fernen Sprechers abgibt ist bezüglich des Mikrofons 2 die Quelle eines unerwünschten Eingangssignals, und zwar entweder auf dem direkten Weg 6 oder dem Reflexionsweg 7. Der direkte Sprachweg des Sprechers am fernen Ende ist mit cbezeichnet
Das in Fig. 1 dargestellte Sprachverarbeitungsnetzwerk besteht aus einem sogenannten Voraussagefilter 9. das mit de· Ausgangsschaltung des Mikrofons 2 verbunden ist. Wie die F ι g. 2 und 3 zeigen, besteht das Filter 9 aus zwei parallelen Zweigen. Der erste Zweig isi eine Vorhersageschaltung 11, die ein Netzwerk sein kann, das aus einem Verzögerungsnetzwerk 12 und einem Verstärker 13 besteht Der zweite Zweig ist ein direkter Nebenschlußpfad. Beide Zweige sind über einen Subtrahierer 10 miteinander verbunden. Die Vorhersageschaltung 11 wird in einer noch zu beschreibenden Weise von einem Parameterextraktor 14 gesteuert, der in den Kreis des Lautsprechers 1 eingeschaltet ist.
Gemäß einem Ausführungsbeispiel der Erfindung erfolgt die Sprechverarbeitung digital. Ein Tiefpaß 15 mit einer vorzugsweisen Grenzfrequenz von 3 kHz und ein 6 kHz-Abtaster 16 sind in Reihe in die Ausgangsschaltung des Mikrofons 2 eingeschaltet. In ähnlicher Weise sind ein Tiefpaß 17 und ein Abtaster 18 parallel zur Eingangsschaltung des Lautsprechers 1 geschaltet und ferner in Reihe mit dem Parameterextraktor 14 verbunden.
Eine Wellenform, die das Signal c des Sprechers am fernen Ende repräsentiert, ist in F i g. 4 dargestellt. Da ein Sprachsignal redundant ist, d.h. das Signal verändert seine äußere Form und die Länge der Grundwellenperiode von einer Grundwellenperiode zur nächsten nur sehr wenig, kann die Augenblicksform oder der Wert des Signals c durch eine lineare Vorhersage geschätzt werden, die auf einem früheren Wert des Signals c beruht.
Das in F i g. 4 dargestellte Signal c ist aus Sprache in aufeinanderfolgenden Grundwellenperioden /ι, 4, /3 usw.
aufgebaut. In den Sprachsignalen in den benachbarten Sprachgrundwellenperioden des Signals c sind ungleiche Amplituden vorhanden. So kann die Verstärkung b so errechnet werden (hier nicht beschrieben), daß, wenn sie auf das abgetastete Signal der Grundwellenperiode 1\ angewendet wird, sie bewirkt, daß dieses Signal sich dem in der nächsten Grundwellenperiode h abgetasteten Signal annähert. Wenn dann das verstärkte Signal der Periode /1 subtraktiv mit dem Signalwert der
Periode h kombiniert wird, dann ergibt sich im wesentlichen eine Ausfilterung des Signals c. In ähnlicher Weise wird das gleiche Resultat erzielt, wenn das verstärkte Signal der Periode 1\ subtraktiv mit dem zusammengesetzten Signal a + c in dem Subtrahierer 10 kombiniert wird.
Dieses in mathematischen Termen ausgedrückt, bedeutet, daß Wn (die Amplitude des Abtastwertes n, der den SubtraWerer 10 über den direkten Weg in dem Vorhersagefilter 9 erreicht), wird subtraktiv mit Wn-* (der Amplitude des verzögerten Abtastwertes) kombiniert, wobei k die Zahl der Abtastungen in einer Grundwellenperiode ist. Vorzugsweise wird das Zeitfenster, über dem die Parameter ausgewertet werden, in der Größenordnung der Grundwellenperiode, um sicherzustellen, daß genügend Energie vorhanden ist. Ein Zeitfenster von 30 Abtastwerten mit einer Abtastfolgefrequenz von 6 kHz erfaßt in einer gegebenen Grundwellenperiode eine Zahl von Abtastwerten, die zwischen der halben und der Gesamtzahl der Abtastwerte liegt.
Da die Sprache während der Intonisation nur quasi-stationär ist, müssen der Verzögerungsparameter k und der Verstärkungsparameter b periodisch errechnet werden. Dieses wird mit Hilfe des digitalen Parameterextraktors 14, entsprechend der Lehre der US-Patentschrift 36 31 520, die bereits erwähnt wurde, durchgeführt.
Wie dort ausgeführt wird, werden die Eingangssprachabtastwerte vom Abtaster 18 als »Rahmen« von Signalen gespeichert. Der Speicherinhalt wird dann zu einer Recheneinheit übertragen, die einen Teil des Parameterextraktors 14 bildet, und in der für 30 Abtastwerte Korrelationsrechenwerte X1 gemäß folgender Beziehung errechnet werden:
Σ w-w-,
γ _ η-η
' Γ Ν T»Γ Ν ϊ''
Inn J L""0 J
wobei η vorzugsweise im Bereich von 30 — 60 Abtastungen liegen kann.
Die errechneten Werte von X1 werden dann in einem Netzwerk, das ebenfalls Teil des Extraktors 18 ist, auf die Lage von Spitzenwerten hin untersucht, um den größten Wert von X1 zu bestimmen. Der Wert von j wird auf die Weise gefunden, daß X1 das Maximum aller Werte von X ist. Dieser bestimmte Wert von j ist der Verzögerungsparameter k, der als einer der Parameter zu dem Vorhersageiilter 9 übertragen wird. Es ist zu sehen, daß k eine variable Verzögerung ist. und daß der Maximalwert von X1 Xt ist Der Verzögerungsparameter k ist für einen typischen stimmhaften Sprachabschnitt in F i g. 6 dargestellt
Der Verstärkungsparameter b wird ebenfalls von der Rechenschaltung in dem Parameterextraktor 14 nach folgender Beziehung errechnet:
Σ W"W-
b =
Der Verstärkungsparameter b wird in ähnlicher Weise zu dem Vorhersagefilter 9 übertragen.
Die beschriebene Errechnung des Verzögerungsparameters k und Verstärkungsparameters b ist nur eine von mehreren Möglichkeiten, durch die aus einer Analyse des Sprachenergieinhalts in benachbarten oder im wesentlichen benachbarten Signalabschnitten Parameter errechnet werden können, die, wenn sie auf einen früheren Signalabschnitt angewendet werden, den letzteren in seiner Gestalt ziemlich ähnlich mit der Gestalt des augenblicklich vorliegenden Signalabschnitts halten werden.
Daher wird die zu dem Lautsprecher 1 übertragene Sprache kontinuierlich analysiert, um aus ihr einen optimalen Verzögerungsparameter und einen Verstärkungsfaktor zu extrahieren. Diese Parameter werden periodisch, beispielsweise alle 5rns auf den neuesten Stand gebracht. Wenn am Lautsprecher 1 kein ankommendes Sprachsignal vorliegt, sind Verzögerung und Verstärkung null. Bei einem ankommenden Signal wird der errechnete augenblickliche Signalausgangswert der Vorhersageschaltung 11 von dem unverzögerten, unverstärkten Signalabtastwert subtrahiert, der die Signale a + cdarstellt.
Die Rückumwandlung in die analoge Form des Signals in der Ausgangsschaltung des Mikrofons 2 erfolgt in einem Digital-/Analogwandler 1OA
Das in F i g. 3 dargestellte und oben beschriebene Filter hat eine Übertragungsfunktion in Z-Transformationsschreibweise.
H(Z) = \-bZ-
(3)
Die Größe der Frequenzabhängigkeit einer typischen Ausführungsform des Filters 9 ist in F i g. 5 dargestellt, in der eine Vorhersageschaltung 11 verwendet wird, und T die Abtastperiode angibt.
Die Frequenzabhängigkeit für Verstärkungsparameter bs 1 wird durch den ausgezogenen Kurvenverlauf und für Verstärkungsparameter b> 1 durch gestrichelte Linien dargestellt. Da die Sprache während der Intonisation dynamisch ist, müssen die Parameter 6 und k. wie oben festgestellt wurde, optimal gewählt und periodisch, beispielsweise alle 5 ms, auf den neuesten Stand gebracht werden.
Die Filterung der Eingangssprache mit Hilfe der errechneten Parameter führt während der Intonisation zu einer Unterdrückung bis zu 30 dB während des Vorliegens stimmhafter Sprachabschnitte des unerwünschten Signals c und zu einer mittleren Unterdrükkung von etwa 14 dB des unerwünschten Signals c.
Die errechneten Parameter b und it verändern sich bezüglich der Zeit nicht sanft. Die optimale Verzögerung verdoppelt sich gelegentlich während stimmhafter Sprachabschnitte. Auch während stimmloser Sprachabschnitte verändert sich die optimale Verzögerung über einen weiten Bereich, während die Korrelation relativ niedrig bleibt. Die errechneten Verstärkungen sind
fan jedoch während dieser stimmlosen Sprachabschnitte nicht vernachlässigbar.
Die gewünschte Sprache a, die bezüglich des unerwünschten Signals α das unterdrückt werden soll, nicht korreliert ist. wird gedämpft wenn es durch ein
bi Filter übertragen wird, das diese schnell veränderlichen Filterparameter besitzt während unter solchen Bedingungen keine zusätzliche Unterdrückung des unerwünschten Sprachsignals erfolgt
Um diese Schwierigkeiten zu vermeiden, wird eine Logikschaltung eingebaut, um unerwünschte Veränderungen der Filterparameter b und k zu verhindern. Es wurde festgestellt, daß keine allzu große Unterdrückung erzielt wurde, wenn die Korrelation X/, kleiner als 0,85 war. Daher wird die Verstärkung b für Λ*<0,85 gleich null gesetzt. Dieses erfolgt durch eine Parametersteuerschaltung 19 in Fig. 1, die b für A"i<0,85 gleich null setzt. Die Wahl von Xk stellt einen Kompromiß dar zwischen einem größtmöglichen und einem ausreichend kleinen Wert, so daß alle stimmhaften Sprachabschnitte unterdrückt werden. Die resultierende Unterdrückung während der Intonisation ist unverändert, während die Dämpfung eines zweiien Sprachsignals verringert wird. F ι g. 6 zeigt die Verhinderung des Verzögerungsparameters k während eines typischen stimmhaften Sprachabschnittes.
Da die Parameter b und k sich während stimmhafter Sprachabschnitte relativ langsam verändern, ist das Vorhersagefilter 9 effektiv bei der Entfernung eines Teils des reflektierenden Signals, wie auch des direkten. Speziell der Teil des reflektierten Signals, dessen Parameter nicht zu sehr von den Filterparametern abweicht, wird in der Amplitude verringert.
Bei der obigen Erläuterung der Erfindung wurde angenommen, daß bei handfreien Fernsprechapparaten Lautsprecher 1 und Mikrofon 2 nicht getrennt voneinander angeordnet waren. In der Praxis jedoch wird eine beträchtliche Übergangszeit für das Wandern des Signals c längs des Weges 6 zu dem Mikrofon 2 benötigt. Es ist daher erforderlich, in dem Sprachverarbeitungsnetzwerk 8 die Lautsprecher-Mikrofonübergangszeit zu kompensieren. Dieses erfolgt mittels der Parameterverzögerungsschaltung 19A die in Reihe zwischen dem Ausgang der Parametersteuerung 19 und dem Vorhersagefilter 9 eingeschaltet ist. Die Parameter-Verzögerungsschaltung 19/4 ist vorteilhafterweise mit einer Einstellschaltung 19ß für die Dauer der Verzögerung ausgestattet, mit deren Hilfe eine Verzögerung eingestellt werden kann, die der Übergangszeitchrakteristik jedes gegebenen handfreien Fernsprechapparates entspricht.
Die Fig. 7 und 8 zeigen die Kombination eines Vorhersagefilters mit einer Echounterdrückungsschalter-Mittenklippung gemäß der Deutschen Patentanmeldung P 21 56 641.2. Diese Kombination stellt einen möglichen Ersatz für Sprachumschaltung dar. die gegenwärtig für die Echo- und Rückkopplungsunterdrückung verwendet wird.
F i g. 7 zeigt ein mit 50 bezeichnetes Netzwerk für die Beseitigung des Echos eines fernen Sprechers bei einem handfreien 4-Draht-Fernsprechapparat. In dieser Figur bezeichnen gleiche Nummern solche Bauteile, die den g'cicheri Bauteilen in den Fig. J—3 entsprechen. Das ferne Echo, das durch das Mikrofon 2 von dem Lautsprecher 1 aufgenommen wird, wird zuerst in seiner Amplitude während stimmhafter Sprachabschnitte von dem Sprachverarbeitungsnetzwerk 8 in der zuvor erläuterten Weise verringert Verstärkungs- und Verzögerungsparameter b und k des fernen Sprachsignals werden bezüglich des empfangenen Lautsprechersignals gemessen und die ferne Echokomponente des Mikrofonsignals durch die Filterung reduziert. Das übrig bleibende Ferne Signal am Ausgang des Sprachverarbeitungsnetzwerks 8 wird dann von dem Echounterdrücker mit Mittenklippung entfernt.
Wie in der oben genannten deutschen Patentanmeldung beschrieben wurde, wird nun das empfangene Signal dazu benutzt, die Klipp-Niveaus mit Hilfe der Klippungssteuerung 22 so einzustellen, daß sie gerade das Echo beseitigen. Das Ausgangssignal des Digital-/ Analogwandlers MM wird zu der Filterbank 40 übertragen, die mehrere aneinandergrenzende Bandfilter im Sprachfrequenzbereich enthält. Im Mittenklipper 41 wird das Signal in jedem Unterband des Filters 40 bei einem Niveau mittengeklippt, das von der Klippersteuerung 22 bestimmt wird und das das Energieniveau in
ίο dem empfangenen Signal innerhalb jedes Unterbandes mißt. Das Ausgangssignal des Klippers 41 wird in der Filterbank 42 gefiltert, die einen ähnlichen Aufbau wie die Filterbank 40 besitzt. Bei diesem Ausführungsbeispiel wird die Klippersteuerung 22 in vorteilhafter Weise ebenfalls von dem Parameterextraktor 14 gesteuert. Da das Echo von dem Vorhersagefilter 9 während der Intonisation verringert wird, können die Klippniveaus um im wesentlichen den gleichen Betrag während der Intonisation verringert werden. Daher ist in F i g. 7 ein Steuersignal dargestellt, (gestrichelte Leitung) zwischen dem Parameterextraktor 14 und der Klippersteuerung 22, das eine Dämpfung des Eingangssignals zur Klipperniveausteuerung 22 bewirkt, die gleich der von dem Sprachverarbeitungsnetzwerk 8 erzielten Unterdrückung ist.
Das optimale Arbeiten der Klipperniveausteuerung
22 kann verwirklicht werden, wenn eine Verzögerung in ihren Eingangspfad eingefügt wird, um die bereits erwähnte Signalübergangszeit zwischen Lautsprecher 1
jo und Mikrofon 2 zu kompensieren. Mit auf diese Weise während stimmhafter Sprachabschnitte reduzierten Klippungsniveaus wird eine geringere Verstümmelung der Sprache am nahen Ende durch den Mittenklippungsprozeß erzielt. F i g. 8 zeigt eine Schaltung für die Eliminierung sowohl des Nahendechos (Echo des fernen Sprechers, bewirkt von der akustischen Kopplung durch die Raumakustik) als auch des nahen Echos (Echo des nahen Sprechers, bewirkt durch eine ungenügende Rückhördämpfungsschaltung) bei einem handfreien 2-Draht-Fernsprechapparat. Das ferne Echo wird von dem Netzwerk 50 in der oben im Zusammenhang mit F i g. 7 beschriebenen Weise eliminiert. Das nahe Echo wird von einer ähnlichen Schaltung 51 eliminiert, die auf der Empfangsseite des örtlichen 4-Draht-Netzwerkes eingeschaltet ist, wie die Figur zeigt.
Ein alternatives Verfahren zur Einstellung der Klipper-Niveausteuerung durch den Parameterextraktor 14 über die Parameterverzögerungsschaltung 19/4 ist in der Schaltung 51 gezeigt Ein zweites Vorhersageso filter 9Λ dient in der Schaltung 51 zur Dämpfung der Signale der Klippemiveausteuerung während stimmhafter Sprachsignale Daher folgen die Klipperpegel dem Signal am Eingang des Schmalband-Mittenklippers, d.h. an dem Ausgang des Vorhersagefihers 9A
Ein weiteres Ausführungsbeispiel gestattet die Unterdrückung des Sprachsignals eines von zwei Sprechern in einem Raum. F i g. 9 zeigt die erwünschte Sprachquelle
23 und eine unerwünschte Sprachquelle 24, während beide Sprachsignale das Eingangssignal für die Mikrofo-
bo ne 25 und 26 bilden. Die unerwünschte Quelle 24 ist so angeordnet, daß Zeitverzögerungen für die direkte Klangübertragung zu den Mikrofonen 25 und 26 gleich sind. Im Ausgangskreis des Mikrofones 25 befindet sich, wie F i g. 2 zeigt, das Vorhersagefilter 9, das bereits
b5 früher erläutert wurde. Die Vorhersageschaltung 11 in Fi g. 3 wird von einem 2-Mikrofon-Parameterextraktor 30 gesteuert
Zwei Signale. \V„ vom Mikrofon 25 und Wn vom
Mikrofon 26, treten in den Parameterextraktor 30 ein, in dem eine Rechenschaltung die folgenden Rechenwerte errechnet:
(4)
η = 0
"'" S W
(5)
Ein Spitzenwertselektionsnetzwerk innerhalb des Extraklors wählt dann die Spilzenwefte von Xj und Yj aus, und ein Vergleicher findet den größten Spitzenwert, der in beiden Folgen Xj und Y1- für den gleichen Wert von j auftritt. Der Wert von j ist der Verzögerungsparameter k für das unerwünschte Sprachsignal, das zu dem Vorhersagefilter 9 übertragen wird.
10
Ein alternatives Verfahren für die Extraktion der Parameter ist in Fig. 10 dargestellt. Zwei zusätzliche Mikrofone 27 und 28 sind so angeordnet, daß die Verzögerungszeiten des erwünschten Sprachsignals 24 für die direkte Tonübertragung zu den Mikrofonen 27 und 28 gleich den Zeitverzögerungen zu den Mikrofonen 25 und 26 sind. Die Ausgangssignale aller Mikrofone 25 bis 28 werden von einem bekannten, nicht-linearen Verarbeiter 31 verarbeitet.
Das Ausgangssignal des Verarbeiters 31 enthält das unerwünschte Signal und eine gedämpfte und gestörte Komponente des gewünschten Signals. (Die Ausgangssignale können alternativ addiert werden, um bloß das gewünschte Signal zu dämpfen). Das Ausgangssignal des nicht-linearen Verarbeilers 31 wird zu dem Sprachverarbeitungsnetzwerk 8 übertragen, welches das unerwünschte Sprachsignai 24 in der bereits beschriebenen Weise ausfiltert. Das Vorliegen eines geringen Betrages eines Sprachsignals am Ausgang des nicht-linearen Verarbeiters 31 beeinflußt den Verzögerungsparameter k nur gering, er führt jedoch zu einem kleinenFehler bei der Auswertung von Xk und b.
Hierzu 4 Blatt Zeichnungen

Claims (4)

Patentansprüche:
1. Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters mit einer Anordnung zur Ableitung einer elektrischen Wellenform, die ein Sprachsignal repräsentiert, einer Anordnung zur Ableitung von Parametern eines Sprachsignals, die von dem Sprachsignal während der Intervalle der Grundwellenperiode gesteuert wird, und einer Anordnung, die auf die abgeleiteten Parameter für die Wiedergewinnung der elektrischen Wellenform anspricht, dadurch gekennzeichnet, daß die Anordnung (19,19y4-Fig. 1) für die Ableitung der Parameter des Sprachsignals einen Verzögerungs- und Verstärkungsparameter unerwünschter Sprachsignale (c) während eines Intervalles ableitet, das einen wesentlichen Teil der GrunJwellenperiode des unerwünschten Sprachsignals umfaßt, welche Parameter dazu verwendet werden, das unerwünschte Sprachsignal wiederzugewinnen, und daß schließlich eine Kombinationsschaltung vorgesehen ist, die das wiedergewonnene, unerwünschte Sprachsignal mit einer Kombination (a + c) des unerwünschten und eines erwünschten (a) Sprachsignals kombiniert, so daß das gewünschte Sprachsignal übrig bleibt.
2. Schaltungsanordnung nach Anspruch 1, dadurch gekennzeichnet, daß die Anordnung (19, 19/1; Fig. 1) für die Ableitung der Parameter der unerwünschten Sprachsignalwerte mit einer ankommenden Leitung verbunden ist, und daß die Kombinationsschaltung (9; Fig. 2) mit einer abgehenden Leitung verbunden ist, um die Spiegelungen des ankommenden Signals auf der abgehenden Leitung zu beseitigen.
3. Schaltungsanordnung nach Anspruch 2, dadurch gekennzeichnet, daß die ankommende Leitung mit der abgehenden Leitung über einen akustischen Pfad (7; Fig. 1) eines handfreien Fernsprechapparates verbunden ist, wodurch die Kombinatbnsschaltung (9; Fig.2) die ankommenden Signale, die auf die abgehende Leitung übertragen werden, durch den akustischen Kopplungspfad beseitigt werden.
4. Schaltungsanordnung nach Anspruch 2, dadurch gekennzeichnet, daß die Anordnung (19, 19Λ; Fig. 1) für die ankommenden Signale eine Einrichtung beinhaltet, die auf das Fehlen des ankommenden Signals mit der Unterbrechung der Zuführung der wiedergewonnenen Signale zu der Kombinationsschaltung (9) anspricht.
DE2207141A 1971-12-03 1972-12-16 Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters Expired DE2207141C3 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US20450971A 1971-12-03 1971-12-03

Publications (3)

Publication Number Publication Date
DE2207141A1 DE2207141A1 (de) 1973-08-02
DE2207141B2 DE2207141B2 (de) 1980-10-09
DE2207141C3 true DE2207141C3 (de) 1981-07-30

Family

ID=22758195

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2207141A Expired DE2207141C3 (de) 1971-12-03 1972-12-16 Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters

Country Status (5)

Country Link
US (1) US3784747A (de)
JP (1) JPS55760B2 (de)
CA (1) CA952439A (de)
DE (1) DE2207141C3 (de)
GB (1) GB1369711A (de)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1458663A (en) * 1972-12-15 1976-12-15 Ard Anstalt Microphone circuits
US4024358A (en) * 1975-10-31 1977-05-17 Communications Satellite Corporation (Comsat) Adaptive echo canceller using differential pulse code modulation encoding
US4031338A (en) * 1976-02-10 1977-06-21 Communications Satellite Corporation (Comsat) Echo suppressor using frequency-selective center clipping
US4122303A (en) * 1976-12-10 1978-10-24 Sound Attenuators Limited Improvements in and relating to active sound attenuation
US4166924A (en) * 1977-05-12 1979-09-04 Bell Telephone Laboratories, Incorporated Removing reverberative echo components in speech signals
CA1123955A (en) * 1978-03-30 1982-05-18 Tetsu Taguchi Speech analysis and synthesis apparatus
FR2451676A1 (fr) * 1979-03-12 1980-10-10 Soumagne Joel Detecteur d'echo notamment pour systeme de communication a interpolation de parole
US4473906A (en) * 1980-12-05 1984-09-25 Lord Corporation Active acoustic attenuator
JPS583430A (ja) * 1981-06-30 1983-01-10 Nec Corp まわり込信号抑圧装置
JPH069000B2 (ja) * 1981-08-27 1994-02-02 キヤノン株式会社 音声情報処理方法
JPS5961321A (ja) * 1982-09-30 1984-04-07 Nec Corp エコ−信号抑圧装置
EP0106640B1 (de) * 1982-10-15 1986-07-16 British Telecommunications Rauschbeherrschungsschaltung
US4629829A (en) * 1984-12-14 1986-12-16 Motorola, Inc. Full duplex speakerphone for radio and landline telephones
US4819263A (en) * 1986-06-30 1989-04-04 Cellular Communications Corporation Apparatus and method for hands free telephonic communication
CA2049173C (en) * 1990-08-16 1996-06-25 Shoji Fujimoto Speech recognition apparatus
GB2281680B (en) * 1993-08-27 1998-08-26 Motorola Inc A voice activity detector for an echo suppressor and an echo suppressor
JP3289057B2 (ja) * 1996-02-06 2002-06-04 品川白煉瓦株式会社 浸漬ノズル交換装置
EP0881814A1 (de) * 1997-05-28 1998-12-02 Deutsche Telekom AG Verfahren zur Bestimmung des Schrifttweitenfaktors Alpha zur Einstellung der Adaptionsgeschwindigkeit des NMLS-Adaptionsalgorithmus
SG71035A1 (en) * 1997-08-01 2000-03-21 Bitwave Pte Ltd Acoustic echo canceller
US6442275B1 (en) 1998-09-17 2002-08-27 Lucent Technologies Inc. Echo canceler including subband echo suppressor
DE19942868A1 (de) 1999-09-08 2001-03-15 Volkswagen Ag Verfahren zum Betrieb einer Mehrfachmikrofonanordnung in einem Kraftfahrzeug sowie Mehrfachmikrofonanordnung selbst
US6243322B1 (en) * 1999-11-05 2001-06-05 Wavemakers Research, Inc. Method for estimating the distance of an acoustic signal
US7043014B2 (en) * 2002-05-22 2006-05-09 Avaya Technology Corp. Apparatus and method for time-alignment of two signals
US7027593B2 (en) * 2002-05-22 2006-04-11 Avaya Technology Corp. Apparatus and method for echo control
US7734034B1 (en) 2005-06-21 2010-06-08 Avaya Inc. Remote party speaker phone detection
CN112237008B (zh) * 2018-06-11 2022-06-03 索尼公司 信号处理装置、信号处理方法和计算机可读存储介质
CN112203188B (zh) * 2020-07-24 2021-10-01 北京工业大学 一种自动音量调节方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3177489A (en) * 1960-01-11 1965-04-06 Thompson Ramo Wooldridge Inc Interference suppression systems
US3133990A (en) * 1962-04-27 1964-05-19 Altec Lansing Corp Automatic level-adjustment circuit
GB1172089A (en) * 1965-09-29 1969-11-26 Superior Continental Corp A Communication System
US3631520A (en) * 1968-08-19 1971-12-28 Bell Telephone Labor Inc Predictive coding of speech signals
US3644674A (en) * 1969-06-30 1972-02-22 Bell Telephone Labor Inc Ambient noise suppressor
US3601549A (en) * 1969-11-25 1971-08-24 Bell Telephone Labor Inc Switching circuit for cancelling the direct sound transmission from the loudspeaker to the microphone in a loudspeaking telephone set

Also Published As

Publication number Publication date
DE2207141A1 (de) 1973-08-02
US3784747A (en) 1974-01-08
JPS55760B2 (de) 1980-01-09
GB1369711A (en) 1974-10-09
JPS4865813A (de) 1973-09-10
DE2207141B2 (de) 1980-10-09
CA952439A (en) 1974-08-06

Similar Documents

Publication Publication Date Title
DE2207141C3 (de) Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters
DE60108401T2 (de) System zur erhöhung der sprachqualität
EP1251493B1 (de) Verfahren zur Geräuschreduktion mit selbststeuernder Störfrequenz
DE69738288T2 (de) Einrichtung zur unterdrückung einer störenden komponente eines eingangssignals
DE2818204C2 (de) Signalverarbeitungsanlage zur Ableitung eines störverringerten Ausgangssignals
DE69734932T2 (de) Schätzung der verzögerung auf einem echopfad
EP0948237B1 (de) Verfahren zur Störbefreiung eines Mikrophonsignals
DE60024815T2 (de) System und verfahren zur erkennung eines nahen sprechers durch spektrumanalyse
EP0614304A1 (de) Verfahren zum Verbessern der akustischen Rückhördämpfung von elektroakustischen Anlagen
DE102008039329A1 (de) Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts
DE2156647A1 (de) Schaltungsanordnung zur Unterdrückung von unterhalb eines Signalpegels liegenden Anteilen von Signalen einer Nachrichtenübertragungseinrichtung
DE68916219T2 (de) Schallabgleichungsanordnung für einen sprachumschaltbaren Lautfernsprecher.
DE69926451T2 (de) Verfahren und Vorrichtung zur Unterdrückung von Mehrkanalechos
DE1537739B2 (de) Schaltung zur sich selbst einstellenden echounterdrueckung in zweiweg signaluebertragungssystemen
EP1189419B1 (de) Verfahren und Vorrichtung zur Elimination Lautsprecherinterferenzen aus Mikrofonsignalen
DE19806015C2 (de) Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
DE60317368T2 (de) Nichtlinearer akustischer echokompensator
DE69817461T2 (de) Verfahren und Vorrichtung zur optimierten Verarbeitung eines Störsignals während einer Tonaufnahme
DE102015204010B4 (de) Verfahren zur Unterdrückung eines Störgeräusches in einem akustischen System
DE102018117558A1 (de) Adaptives nachfiltern
DE3431141A1 (de) Transversalfilter-echokompensator fuer lange akustische echos
DE69216384T2 (de) Verfahren zur nichtlinearen signalverarbeitung in einem echokompensator
DE19639580C2 (de) Vorrichtung zur Reduktion akustischer Echos
DE2316699C3 (de) Echokompensationsschaltung zur Auslöschung von Echos auf Fernsprechleitungen
DE60225089T2 (de) Verfahren und Vorrichtung zur Vor- und Nachbearbeitung eines Audiosignals zur Übertragung über einen sehr gestörten Kanal

Legal Events

Date Code Title Description
OD Request for examination
C3 Grant after two publication steps (3rd publication)
8339 Ceased/non-payment of the annual fee