DE2207141C3

DE2207141C3 - Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters

Info

Publication number: DE2207141C3
Application number: DE2207141A
Authority: DE
Inventors: Olga Mary Mracek Summit N.J. Mitchell
Original assignee: Western Electric Co Inc
Current assignee: AT&T Corp
Priority date: 1971-12-03
Filing date: 1972-12-16
Publication date: 1981-07-30
Also published as: DE2207141A1; US3784747A; JPS55760B2; GB1369711A; JPS4865813A; DE2207141B2; CA952439A

Description

55

Die Erfindung betrifft eine Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters mit einer Anordnung zur Ableitung einer elektrischen Wellenform, die ein Sprachsignal repräsentier;, einer Anordnung zur Ableitung von Parametern eines Sprachsignals, die vom Sprachsignal während der Intervalle der Sprachgrundwellenperiode gesteuert wird und einer Anordnung, die auf die abgeleiteten Parameter für die Wiedergewinnung der elektrischen Wellenform anspricht.

Bei der Telefonie und anderen einschlägigen Gebieten kommt es häufiger vor, daß die Sprache einer Quelle, die ein Zuhörer zu hören wünscht, in ihrer Verständlichkeit ernsthaft durch die Sprache einer zweiten unerwünschten Quelle gestört wird. Zur Verringerung der Wirkungen der zweiten Sprachquelle wurden bereits zahlreiche Vorschläge gemacht Diese betreffen eine relative Verbesserung des erwünschten Spr?.chsignals, indem das unerwünschte Sprachsignal relativ unverständlich gehalten wird oder indem die Energie des unerwünschten Signals herabgesetz' wird. Unabhängig von der Art und Weise der Verbesserungen wurde als typisches Resultat erzielt, daß das gewünschte Sprachsignal nun verständlicher war, als es bei dem vollständigen Fehler, einer Sprachverarbeitung gewesen wäre. Die »Freihand«-Telefone sind Musterbeispiele für dieses Problem der gegenseitig in Konflikt geratenden Sprachquellen, da deren elektroakustischer Wandler (Lautsprecher) eine potentielle Quelle von unerwünschten Signalen am Mikrofon der gleichen Sprechstelle darstellen.

Die Aufgabe der vorliegenden Erfindung besteht nun darin, den genannten Nachteil der Störung eines gewünschten Sprachsignals durch ein unerwünschtes, insbesondere bei »Freihand«-Telefonen zu vermeiden.

Für eine Sprachverarbeitungseinrichtung der eingangs genannten Art wird diese Aufgabe dadurch gelöst, daß die Anordnung für die Ableitung der Parameter des Sprachsignals einen Verzögerungs- und Verstärkungsparameter unerwünschter Sprachsignalwerte (c) während eines Intervalls ableitet, das einen wesentlichen Teil der Grundwellenperiode des unerwünschten Sprachsignals umfaßt, welche Parameter dazu verwendet werden, das unerwünschte Sprachsignal wiederzugewinnen, und daß schließlich eine Kombinationsschaltung vorgesehen ist, die das wiedergewonnene, unerwünschte Sprachsignal mit einer Kombination (a + c) des unerwünschten und eines erwünschten (a) Sprachsignals kombiniert, so daß das gewünschte Sprachsignal übrig bleibt.

Eine weitere Ausgestaltung der Erfindung betrifft eine Schaltungsanordnung, bei der das unerwünschte Signal über eine ankommende Leitung in einer Empfängerstelle empfangen wird und die Kombinationsschaltung an eine abgehende Leitung für das Auslöschen ankommender Sprachsignale angeschlossen wird, die in Kombination mit dem abgehenden Signal vorliegen können.

Weitere, vorteilhafte Ausgestaltungen und Weiterbildungen des Gegenstandes der Erfindung sind den Unteransprüchen zu entnehmen.

Die Vorteile der Erfindung ergeben sich im wesentlichen aus der nachfolgenden Betrachtung:

Die Erfindung beruht auf der allgemeinen Erkenntnis, daß ein unerwünschtes Sprachsignal auf der Basis seiner Sprachparameter unterdrückt werden kann.

Der US-Patentschrift 36 31 520 sind bestimmte Sprachparameter zugrundegelegt. Ferner ist dort eine »vorhersagende Codierungs«-Technik für die Verringerung der Übertragungsbandbreite angegeben, in der eine Abschätzung des Augenblickswertes der Sprachsignalabtastung auf der Basis eines bekannten entsprechenden vorhergehenden Wertes vorgenommen wird. Aus diesen Daten wird ein Differenz- oder Fehlersignal erzeugt und zu einer fernen Empfangsstation zusammen mit bestimmten Vorhersage-Parametern übertragen. In der fernen Empfangsstation wird das gesamte Signal aus dem Fehlersignal, unter Verwendung der Vorhersage-Parameter, wieder neu gebildet.

Es wurde nun erkannt, daß der in der genannten US-Patentschrift angegebene Prozeß so umgestaltet

werden kann, daß er ein gegebenes, unerwünschtes Sprachsignal im wesentlichen eliminieren kann.

Das grundlegende Konzept der Erfindung besteht darin, aus dem unerwünschten Signal einen Verzögerungs- und einen Verstärkungs-Parametei· abzuleiten. Diese Parameter steuern ein Verzögerungs- und Verstärkungsnetzwerk, durch das sowohl die gewünschten als auch die unerwünschten Signale geleitet werden. Die Verzögerungszeit entspricht etwa der augenblicklichen Dauer der Grundwellenperiode des unerwünschten Sprachsignals. Die Verstärkung wird nach einer von mehreren möglichen Formeln errechnet, so daß so das verzögerte, unerwünschte Signal auf ein Amplituden-Niveau des vorliegenden Wertes des unerwünschten Sprachsignals gebracht wird. Alternativ hierzu wird bei einer technisch weniger komplexen Ausführung die Verstärkung gleich 1 gesetzt In jedem Falle wird das Ausgangssignal des Netzwerkes dann subtraktiv auf das unerwünschte Sprachsignal oder auf irgendeinem komponenten Signal angewandt, das das urerwünschte Sprachsignal enthält Dieses Verfahren kann entweder in analoger oder digitaler Technik durchgeführt werden.

Von Vorteil ist jedoch, wenn das Verfahren mit Hilfe einer Abtasttechnik durchgeführt wird, bei der das Signal mit einer Folgefrequenz von beispielsweise 6 kHz abgetastet wird, was bedeutet, daß je Grundwellenperiode 30 — 60 Abtastungen durchgeführt werden. Die Zahl der Abtastungen in einer Grundwellenperiode verändert sich mit der Frequenz der Sprachgrundwelle.

Bei einem Ausführungsbeispiel der Erfindung kann die Sprache aus dem Lautsprecher eines handfreien Fernsprechapparates, die entweder direkt oder als Nachhallreflektion auf das Mikrofon des Apparates auftrifft, weitgehend aus dem Ausgangssignal des Mikrofones entfernt werden. Es wird dabei sowohl das Nachhallsignal als auch das direkte Signal unterdrückt, da sich die unerwünschten Sprachparameter während des Sprechens nicht schnell verändern.

Bei einem anderen Ausführungsbeispiel der Erfindung wird beispielsweise die Sprache von zwei Sprechern von einer Mehrzahl von Mikrofonen festgestellt und die Sprache eines Sprechers unter Verwendung der festgestellten Sprachparameter durch die Kombination der Ausgangssignale der Mikrofone unterdrückt.

Es ist nun offensichtlich, daß die Umgestaltung des in der genannten US-Patentschrift aufgezeigten Verfahrens in einem Aspekt ein Filter darstellt, und zwar ein Filter mit kamipförmigem Frequenzspektrum, dessen Minima bei der Sprachgrundfrequenz (und deren Harmonische) des unerwünschten Sprachsignals liegen. Hierin unterscheidet sich das »vorhersagende« Filter der Erfindung von einer konventionellen Echosperre, die nur ein nachhallendes Signal spiegelt und diese Spiegelung von dem zusammengesetzten Signal, das aus dem Signal selbst und seiner Spiegelung besteht, subtrahiert.

Im folgenden wird die Erfindung anhand eines durch Zeichnungen erläuterten Ausführungsbeispieles näher beschrieben. Es zeigt

Fig. 1 das schematische Blockschaltbild eines Sprachübertragungsnetzwerks mit einem handfreien Telefon und der erfindungsgemäßen Anordnung,

Fig.2 ein schematisches Blockschaltbild des erfindungsgemäßen vorhersagenden Filters,

F i g. 3 ein schematisches Blockschaltbild zur weiteren Veranschaulichung der erfindungsgemäßen Vorhersageschaltung,

Fig.4—6 grafische Darstellungen verschiedener Kenniinien der Vorhersagcschaltung,

F i g. 7 u. 8 Darstellungen zweier weiterer Ausführungsbeispiele der Erfindung in einem Sprachübertragungsneizwerk mit handfreien Fernsprechapparaten und

Fig.9 u. 10 schematische Darstellungen der Erfindung für die Unterdrückung der Sprache mehrerer Sprecher in einem Raum.

ίο Bei dem ersten, in F i g. 1 dargestellten Ausführungsbeispiel der Erfindung ist ein handfreier Fernsprechapparat mit einem Lautsprecher 1 und einem Mikrofon 2 in einem nicht hallfreiem Raum 3 an eine Sprachverarbeitungseinrichtung 8 gemäß der Erfindung angeschlossen. Im allgemeinen kommt das gewünschte Sprachsignal als Eingangssignal für das Mikrofon 2 von der Sprachquelle 4, dem nahen Sprecher, dessen Signal a hauptsächlich den direkten Pfad 5 entlang wandert Die Schallreflexic ι der Quelle 4 ist in Fig. 1 nicht dargestellt L?r Lautsprecher 1, der das Signal des fernen Sprechers abgibt ist bezüglich des Mikrofons 2 die Quelle eines unerwünschten Eingangssignals, und zwar entwede^r auf dem direkten Weg 6 oder dem Reflexionsweg 7. Der direkte Sprachweg des Sprechers am fernen Ende ist mit cbezeichnet

Das in Fig. 1 dargestellte Sprachverarbeitungsnetzwerk besteht aus einem sogenannten Voraussagefilter 9. das mit de· Ausgangsschaltung des Mikrofons 2 verbunden ist. Wie die F ι g. 2 und 3 zeigen, besteht das Filter 9 aus zwei parallelen Zweigen. Der erste Zweig isi eine Vorhersageschaltung 11, die ein Netzwerk sein kann, das aus einem Verzögerungsnetzwerk 12 und einem Verstärker 13 besteht Der zweite Zweig ist ein direkter Nebenschlußpfad. Beide Zweige sind über einen Subtrahierer 10 miteinander verbunden. Die Vorhersageschaltung 11 wird in einer noch zu beschreibenden Weise von einem Parameterextraktor 14 gesteuert, der in den Kreis des Lautsprechers 1 eingeschaltet ist.

Gemäß einem Ausführungsbeispiel der Erfindung erfolgt die Sprechverarbeitung digital. Ein Tiefpaß 15 mit einer vorzugsweisen Grenzfrequenz von 3 kHz und ein 6 kHz-Abtaster 16 sind in Reihe in die Ausgangsschaltung des Mikrofons 2 eingeschaltet. In ähnlicher Weise sind ein Tiefpaß 17 und ein Abtaster 18 parallel zur Eingangsschaltung des Lautsprechers 1 geschaltet und ferner in Reihe mit dem Parameterextraktor 14 verbunden.

Eine Wellenform, die das Signal c des Sprechers am fernen Ende repräsentiert, ist in F i g. 4 dargestellt. Da ein Sprachsignal redundant ist, d.h. das Signal verändert seine äußere Form und die Länge der Grundwellenperiode von einer Grundwellenperiode zur nächsten nur sehr wenig, kann die Augenblicksform oder der Wert des Signals c durch eine lineare Vorhersage geschätzt werden, die auf einem früheren Wert des Signals c beruht.

Das in F i g. 4 dargestellte Signal c ist aus Sprache in aufeinanderfolgenden Grundwellenperioden /ι, 4, /3 usw.

aufgebaut. In den Sprachsignalen in den benachbarten Sprachgrundwellenperioden des Signals c sind ungleiche Amplituden vorhanden. So kann die Verstärkung b so errechnet werden (hier nicht beschrieben), daß, wenn sie auf das abgetastete Signal der Grundwellenperiode 1\ angewendet wird, sie bewirkt, daß dieses Signal sich dem in der nächsten Grundwellenperiode h abgetasteten Signal annähert. Wenn dann das verstärkte Signal der Periode /1 subtraktiv mit dem Signalwert der

Periode h kombiniert wird, dann ergibt sich im wesentlichen eine Ausfilterung des Signals c. In ähnlicher Weise wird das gleiche Resultat erzielt, wenn das verstärkte Signal der Periode 1\ subtraktiv mit dem zusammengesetzten Signal a + c in dem Subtrahierer 10 kombiniert wird.

Dieses in mathematischen Termen ausgedrückt, bedeutet, daß W_n (die Amplitude des Abtastwertes n, der den SubtraWerer 10 über den direkten Weg in dem Vorhersagefilter 9 erreicht), wird subtraktiv mit W_n-* (der Amplitude des verzögerten Abtastwertes) kombiniert, wobei k die Zahl der Abtastungen in einer Grundwellenperiode ist. Vorzugsweise wird das Zeitfenster, über dem die Parameter ausgewertet werden, in der Größenordnung der Grundwellenperiode, um sicherzustellen, daß genügend Energie vorhanden ist. Ein Zeitfenster von 30 Abtastwerten mit einer Abtastfolgefrequenz von 6 kHz erfaßt in einer gegebenen Grundwellenperiode eine Zahl von Abtastwerten, die zwischen der halben und der Gesamtzahl der Abtastwerte liegt.

Da die Sprache während der Intonisation nur quasi-stationär ist, müssen der Verzögerungsparameter k und der Verstärkungsparameter b periodisch errechnet werden. Dieses wird mit Hilfe des digitalen Parameterextraktors 14, entsprechend der Lehre der US-Patentschrift 36 31 520, die bereits erwähnt wurde, durchgeführt.

Wie dort ausgeführt wird, werden die Eingangssprachabtastwerte vom Abtaster 18 als »Rahmen« von Signalen gespeichert. Der Speicherinhalt wird dann zu einer Recheneinheit übertragen, die einen Teil des Parameterextraktors 14 bildet, und in der für 30 Abtastwerte Korrelationsrechenwerte X₁ gemäß folgender Beziehung errechnet werden:

Σ ^w-^w-,

γ _ η-η

' Γ ^Ν T»Γ ^Ν ϊ''

Inn J L""0 J

wobei η vorzugsweise im Bereich von 30 — 60 Abtastungen liegen kann.

Die errechneten Werte von X₁ werden dann in einem Netzwerk, das ebenfalls Teil des Extraktors 18 ist, auf die Lage von Spitzenwerten hin untersucht, um den größten Wert von X₁ zu bestimmen. Der Wert von j wird auf die Weise gefunden, daß X₁ das Maximum aller Werte von X ist. Dieser bestimmte Wert von j ist der Verzögerungsparameter k, der als einer der Parameter zu dem Vorhersageiilter 9 übertragen wird. Es ist zu sehen, daß k eine variable Verzögerung ist. und daß der Maximalwert von X₁ Xt ist Der Verzögerungsparameter k ist für einen typischen stimmhaften Sprachabschnitt in F i g. 6 dargestellt

Der Verstärkungsparameter b wird ebenfalls von der Rechenschaltung in dem Parameterextraktor 14 nach folgender Beziehung errechnet:

Σ ^W"^W-

b =

Der Verstärkungsparameter b wird in ähnlicher Weise zu dem Vorhersagefilter 9 übertragen.

Die beschriebene Errechnung des Verzögerungsparameters k und Verstärkungsparameters b ist nur eine von mehreren Möglichkeiten, durch die aus einer Analyse des Sprachenergieinhalts in benachbarten oder im wesentlichen benachbarten Signalabschnitten Parameter errechnet werden können, die, wenn sie auf einen früheren Signalabschnitt angewendet werden, den letzteren in seiner Gestalt ziemlich ähnlich mit der Gestalt des augenblicklich vorliegenden Signalabschnitts halten werden.

Daher wird die zu dem Lautsprecher 1 übertragene Sprache kontinuierlich analysiert, um aus ihr einen optimalen Verzögerungsparameter und einen Verstärkungsfaktor zu extrahieren. Diese Parameter werden periodisch, beispielsweise alle 5rns auf den neuesten Stand gebracht. Wenn am Lautsprecher 1 kein ankommendes Sprachsignal vorliegt, sind Verzögerung und Verstärkung null. Bei einem ankommenden Signal wird der errechnete augenblickliche Signalausgangswert der Vorhersageschaltung 11 von dem unverzögerten, unverstärkten Signalabtastwert subtrahiert, der die Signale a + cdarstellt.

Die Rückumwandlung in die analoge Form des Signals in der Ausgangsschaltung des Mikrofons 2 erfolgt in einem Digital-/Analogwandler 1OA

Das in F i g. 3 dargestellte und oben beschriebene Filter hat eine Übertragungsfunktion in Z-Transformationsschreibweise.

H(Z) = \-bZ-

(3)

Die Größe der Frequenzabhängigkeit einer typischen Ausführungsform des Filters 9 ist in F i g. 5 dargestellt, in der eine Vorhersageschaltung 11 verwendet wird, und T die Abtastperiode angibt.

Die Frequenzabhängigkeit für Verstärkungsparameter bs 1 wird durch den ausgezogenen Kurvenverlauf und für Verstärkungsparameter b> 1 durch gestrichelte Linien dargestellt. Da die Sprache während der Intonisation dynamisch ist, müssen die Parameter 6 und k. wie oben festgestellt wurde, optimal gewählt und periodisch, beispielsweise alle 5 ms, auf den neuesten Stand gebracht werden.

Die Filterung der Eingangssprache mit Hilfe der errechneten Parameter führt während der Intonisation zu einer Unterdrückung bis zu 30 dB während des Vorliegens stimmhafter Sprachabschnitte des unerwünschten Signals c und zu einer mittleren Unterdrükkung von etwa 14 dB des unerwünschten Signals c.

Die errechneten Parameter b und it verändern sich bezüglich der Zeit nicht sanft. Die optimale Verzögerung verdoppelt sich gelegentlich während stimmhafter Sprachabschnitte. Auch während stimmloser Sprachabschnitte verändert sich die optimale Verzögerung über einen weiten Bereich, während die Korrelation relativ niedrig bleibt. Die errechneten Verstärkungen sind

fan jedoch während dieser stimmlosen Sprachabschnitte nicht vernachlässigbar.

Die gewünschte Sprache a, die bezüglich des unerwünschten Signals α das unterdrückt werden soll, nicht korreliert ist. wird gedämpft wenn es durch ein

bi Filter übertragen wird, das diese schnell veränderlichen Filterparameter besitzt während unter solchen Bedingungen keine zusätzliche Unterdrückung des unerwünschten Sprachsignals erfolgt

Um diese Schwierigkeiten zu vermeiden, wird eine Logikschaltung eingebaut, um unerwünschte Veränderungen der Filterparameter b und k zu verhindern. Es wurde festgestellt, daß keine allzu große Unterdrückung erzielt wurde, wenn die Korrelation X/, kleiner als 0,85 war. Daher wird die Verstärkung b für Λ*<0,85 gleich null gesetzt. Dieses erfolgt durch eine Parametersteuerschaltung 19 in Fig. 1, die b für A"i<0,85 gleich null setzt. Die Wahl von X_k stellt einen Kompromiß dar zwischen einem größtmöglichen und einem ausreichend kleinen Wert, so daß alle stimmhaften Sprachabschnitte unterdrückt werden. Die resultierende Unterdrückung während der Intonisation ist unverändert, während die Dämpfung eines zweiien Sprachsignals verringert wird. F ι g. 6 zeigt die Verhinderung des Verzögerungsparameters k während eines typischen stimmhaften Sprachabschnittes.

Da die Parameter b und k sich während stimmhafter Sprachabschnitte relativ langsam verändern, ist das Vorhersagefilter 9 effektiv bei der Entfernung eines Teils des reflektierenden Signals, wie auch des direkten. Speziell der Teil des reflektierten Signals, dessen Parameter nicht zu sehr von den Filterparametern abweicht, wird in der Amplitude verringert.

Bei der obigen Erläuterung der Erfindung wurde angenommen, daß bei handfreien Fernsprechapparaten Lautsprecher 1 und Mikrofon 2 nicht getrennt voneinander angeordnet waren. In der Praxis jedoch wird eine beträchtliche Übergangszeit für das Wandern des Signals c längs des Weges 6 zu dem Mikrofon 2 benötigt. Es ist daher erforderlich, in dem Sprachverarbeitungsnetzwerk 8 die Lautsprecher-Mikrofonübergangszeit zu kompensieren. Dieses erfolgt mittels der Parameterverzögerungsschaltung 19A die in Reihe zwischen dem Ausgang der Parametersteuerung 19 und dem Vorhersagefilter 9 eingeschaltet ist. Die Parameter-Verzögerungsschaltung 19/4 ist vorteilhafterweise mit einer Einstellschaltung 19ß für die Dauer der Verzögerung ausgestattet, mit deren Hilfe eine Verzögerung eingestellt werden kann, die der Übergangszeitchrakteristik jedes gegebenen handfreien Fernsprechapparates entspricht.

Die Fig. 7 und 8 zeigen die Kombination eines Vorhersagefilters mit einer Echounterdrückungsschalter-Mittenklippung gemäß der Deutschen Patentanmeldung P 21 56 641.2. Diese Kombination stellt einen möglichen Ersatz für Sprachumschaltung dar. die gegenwärtig für die Echo- und Rückkopplungsunterdrückung verwendet wird.

F i g. 7 zeigt ein mit 50 bezeichnetes Netzwerk für die Beseitigung des Echos eines fernen Sprechers bei einem handfreien 4-Draht-Fernsprechapparat. In dieser Figur bezeichnen gleiche Nummern solche Bauteile, die den g'cicheri Bauteilen in den Fig. J—3 entsprechen. Das ferne Echo, das durch das Mikrofon 2 von dem Lautsprecher 1 aufgenommen wird, wird zuerst in seiner Amplitude während stimmhafter Sprachabschnitte von dem Sprachverarbeitungsnetzwerk 8 in der zuvor erläuterten Weise verringert Verstärkungs- und Verzögerungsparameter b und k des fernen Sprachsignals werden bezüglich des empfangenen Lautsprechersignals gemessen und die ferne Echokomponente des Mikrofonsignals durch die Filterung reduziert. Das übrig bleibende Ferne Signal am Ausgang des Sprachverarbeitungsnetzwerks 8 wird dann von dem Echounterdrücker mit Mittenklippung entfernt.

Wie in der oben genannten deutschen Patentanmeldung beschrieben wurde, wird nun das empfangene Signal dazu benutzt, die Klipp-Niveaus mit Hilfe der Klippungssteuerung 22 so einzustellen, daß sie gerade das Echo beseitigen. Das Ausgangssignal des Digital-/ Analogwandlers MM wird zu der Filterbank 40 übertragen, die mehrere aneinandergrenzende Bandfilter im Sprachfrequenzbereich enthält. Im Mittenklipper 41 wird das Signal in jedem Unterband des Filters 40 bei einem Niveau mittengeklippt, das von der Klippersteuerung 22 bestimmt wird und das das Energieniveau in

ίο dem empfangenen Signal innerhalb jedes Unterbandes mißt. Das Ausgangssignal des Klippers 41 wird in der Filterbank 42 gefiltert, die einen ähnlichen Aufbau wie die Filterbank 40 besitzt. Bei diesem Ausführungsbeispiel wird die Klippersteuerung 22 in vorteilhafter Weise ebenfalls von dem Parameterextraktor 14 gesteuert. Da das Echo von dem Vorhersagefilter 9 während der Intonisation verringert wird, können die Klippniveaus um im wesentlichen den gleichen Betrag während der Intonisation verringert werden. Daher ist in F i g. 7 ein Steuersignal dargestellt, (gestrichelte Leitung) zwischen dem Parameterextraktor 14 und der Klippersteuerung 22, das eine Dämpfung des Eingangssignals zur Klipperniveausteuerung 22 bewirkt, die gleich der von dem Sprachverarbeitungsnetzwerk 8 erzielten Unterdrückung ist.

Das optimale Arbeiten der Klipperniveausteuerung

22 kann verwirklicht werden, wenn eine Verzögerung in ihren Eingangspfad eingefügt wird, um die bereits erwähnte Signalübergangszeit zwischen Lautsprecher 1

jo und Mikrofon 2 zu kompensieren. Mit auf diese Weise während stimmhafter Sprachabschnitte reduzierten Klippungsniveaus wird eine geringere Verstümmelung der Sprache am nahen Ende durch den Mittenklippungsprozeß erzielt. F i g. 8 zeigt eine Schaltung für die Eliminierung sowohl des Nahendechos (Echo des fernen Sprechers, bewirkt von der akustischen Kopplung durch die Raumakustik) als auch des nahen Echos (Echo des nahen Sprechers, bewirkt durch eine ungenügende Rückhördämpfungsschaltung) bei einem handfreien 2-Draht-Fernsprechapparat. Das ferne Echo wird von dem Netzwerk 50 in der oben im Zusammenhang mit F i g. 7 beschriebenen Weise eliminiert. Das nahe Echo wird von einer ähnlichen Schaltung 51 eliminiert, die auf der Empfangsseite des örtlichen 4-Draht-Netzwerkes eingeschaltet ist, wie die Figur zeigt.

Ein alternatives Verfahren zur Einstellung der Klipper-Niveausteuerung durch den Parameterextraktor 14 über die Parameterverzögerungsschaltung 19/4 ist in der Schaltung 51 gezeigt Ein zweites Vorhersageso filter 9Λ dient in der Schaltung 51 zur Dämpfung der Signale der Klippemiveausteuerung während stimmhafter Sprachsignale Daher folgen die Klipperpegel dem Signal am Eingang des Schmalband-Mittenklippers, d.h. an dem Ausgang des Vorhersagefihers 9A
Ein weiteres Ausführungsbeispiel gestattet die Unterdrückung des Sprachsignals eines von zwei Sprechern in einem Raum. F i g. 9 zeigt die erwünschte Sprachquelle

23 und eine unerwünschte Sprachquelle 24, während beide Sprachsignale das Eingangssignal für die Mikrofo-

bo ne 25 und 26 bilden. Die unerwünschte Quelle 24 ist so angeordnet, daß Zeitverzögerungen für die direkte Klangübertragung zu den Mikrofonen 25 und 26 gleich sind. Im Ausgangskreis des Mikrofones 25 befindet sich, wie F i g. 2 zeigt, das Vorhersagefilter 9, das bereits

b5 früher erläutert wurde. Die Vorhersageschaltung 11 in Fi g. 3 wird von einem 2-Mikrofon-Parameterextraktor 30 gesteuert

Zwei Signale. \V„ vom Mikrofon 25 und W_n vom

Mikrofon 26, treten in den Parameterextraktor 30 ein, in dem eine Rechenschaltung die folgenden Rechenwerte errechnet:

(4)

η = 0

"'" S W

(5)

Ein Spitzenwertselektionsnetzwerk innerhalb des Extraklors wählt dann die Spilzenwefte von Xj und Yj aus, und ein Vergleicher findet den größten Spitzenwert, der in beiden Folgen Xj und Y₁- für den gleichen Wert von j auftritt. Der Wert von j ist der Verzögerungsparameter k für das unerwünschte Sprachsignal, das zu dem Vorhersagefilter 9 übertragen wird.

10

Ein alternatives Verfahren für die Extraktion der Parameter ist in Fig. 10 dargestellt. Zwei zusätzliche Mikrofone 27 und 28 sind so angeordnet, daß die Verzögerungszeiten des erwünschten Sprachsignals 24 für die direkte Tonübertragung zu den Mikrofonen 27 und 28 gleich den Zeitverzögerungen zu den Mikrofonen 25 und 26 sind. Die Ausgangssignale aller Mikrofone 25 bis 28 werden von einem bekannten, nicht-linearen Verarbeiter 31 verarbeitet.

Das Ausgangssignal des Verarbeiters 31 enthält das unerwünschte Signal und eine gedämpfte und gestörte Komponente des gewünschten Signals. (Die Ausgangssignale können alternativ addiert werden, um bloß das gewünschte Signal zu dämpfen). Das Ausgangssignal des nicht-linearen Verarbeilers 31 wird zu dem Sprachverarbeitungsnetzwerk 8 übertragen, welches das unerwünschte Sprachsignai 24 in der bereits beschriebenen Weise ausfiltert. Das Vorliegen eines geringen Betrages eines Sprachsignals am Ausgang des nicht-linearen Verarbeiters 31 beeinflußt den Verzögerungsparameter k nur gering, er führt jedoch zu einem kleinenFehler bei der Auswertung von Xk und b.

Hierzu 4 Blatt Zeichnungen

Claims

Patentansprüche:

1. Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters mit einer Anordnung zur Ableitung einer elektrischen Wellenform, die ein Sprachsignal repräsentiert, einer Anordnung zur Ableitung von Parametern eines Sprachsignals, die von dem Sprachsignal während der Intervalle der Grundwellenperiode gesteuert wird, und einer Anordnung, die auf die abgeleiteten Parameter für die Wiedergewinnung der elektrischen Wellenform anspricht, dadurch gekennzeichnet, daß die Anordnung (19,19y4-Fig. 1) für die Ableitung der Parameter des Sprachsignals einen Verzögerungs- und Verstärkungsparameter unerwünschter Sprachsignale (c) während eines Intervalles ableitet, das einen wesentlichen Teil der GrunJwellenperiode des unerwünschten Sprachsignals umfaßt, welche Parameter dazu verwendet werden, das unerwünschte Sprachsignal wiederzugewinnen, und daß schließlich eine Kombinationsschaltung vorgesehen ist, die das wiedergewonnene, unerwünschte Sprachsignal mit einer Kombination (a + c) des unerwünschten und eines erwünschten (a) Sprachsignals kombiniert, so daß das gewünschte Sprachsignal übrig bleibt.

2. Schaltungsanordnung nach Anspruch 1, dadurch gekennzeichnet, daß die Anordnung (19, 19/1; Fig. 1) für die Ableitung der Parameter der unerwünschten Sprachsignalwerte mit einer ankommenden Leitung verbunden ist, und daß die Kombinationsschaltung (9; Fig. 2) mit einer abgehenden Leitung verbunden ist, um die Spiegelungen des ankommenden Signals auf der abgehenden Leitung zu beseitigen.

3. Schaltungsanordnung nach Anspruch 2, dadurch gekennzeichnet, daß die ankommende Leitung mit der abgehenden Leitung über einen akustischen Pfad (7; Fig. 1) eines handfreien Fernsprechapparates verbunden ist, wodurch die Kombinatbnsschaltung (9; Fig.2) die ankommenden Signale, die auf die abgehende Leitung übertragen werden, durch den akustischen Kopplungspfad beseitigt werden.

4. Schaltungsanordnung nach Anspruch 2, dadurch gekennzeichnet, daß die Anordnung (19, 19Λ; Fig. 1) für die ankommenden Signale eine Einrichtung beinhaltet, die auf das Fehlen des ankommenden Signals mit der Unterbrechung der Zuführung der wiedergewonnenen Signale zu der Kombinationsschaltung (9) anspricht.