DE10137395C1 - Verfahren zur Unterdrückung von Störschall - Google Patents

Verfahren zur Unterdrückung von Störschall

Info

Publication number
DE10137395C1
DE10137395C1 DE2001137395 DE10137395A DE10137395C1 DE 10137395 C1 DE10137395 C1 DE 10137395C1 DE 2001137395 DE2001137395 DE 2001137395 DE 10137395 A DE10137395 A DE 10137395A DE 10137395 C1 DE10137395 C1 DE 10137395C1
Authority
DE
Germany
Prior art keywords
signal
instant
ifi
amplitude
modified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE2001137395
Other languages
English (en)
Inventor
Zlatan Ribic
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INTERTON ELECTRONIC HOERGERAETE GMBH, 51469 BE, DE
Original Assignee
Tuerk & Tuerk Electronic GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tuerk & Tuerk Electronic GmbH filed Critical Tuerk & Tuerk Electronic GmbH
Priority to DE2001137395 priority Critical patent/DE10137395C1/de
Priority to US10/210,641 priority patent/US7092877B2/en
Application granted granted Critical
Publication of DE10137395C1 publication Critical patent/DE10137395C1/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Unterdrückung von Störschall mit folgenden Schritten: DOLLAR A - Gewinnen eines analytischen Signals aus einem Eingangssignal (S¶in¶); DOLLAR A - Berechnen eines Instant-Amplitudensignals (IA) aus dem analytischen Signal; DOLLAR A - Berechnen eines Instant-Phasensignals (IFI) aus dem analytischen Signal; DOLLAR A - nichtlineares Verändern des Instant-Amplitudensignals (IA) zu einem modifizierten Instant-Amplitudensignal (IA¶mod¶); DOLLAR A - Verknüpfung des modifizierten Instant-Amplitudensignals (IA¶mod¶) mit dem Instant-Phasensignal (IFI) zu einem Ausgangssignal (S¶out¶).

Description

Die Erfindung betrifft ein Verfahren zur Unterdrückung von Störschall.
Die Entwicklung von Hörgeräten ist in den letzten Jahren so weit perfektioniert worden, dass technische Probleme nahezu ausgeschlossen beziehungsweise un­ bedeutend sind. Nach wie vor drängend ist jedoch das Problem, die Signale bei der Verstärkung so zu bearbeiten, dass die Nutzsignale möglichst verlustfrei übertragen werden und die Störsignale so weit als möglich unterdrückt werden.
Aber auch bei anderen Anwendungen, wie etwa im Bereich der Nachrichtenüber­ tragung über Telefonleitungen oder per Funk ist die Unterdrückung von Stör­ schall ein wichtiges Thema.
Ein einfacher Ansatz besteht darin, durch Anwendung von Hochpassfiltern, Tief­ passfiltern oder Bandpassfiltern bestimmte Frequenzbereiche abzuschwächen, in denen ein hoher Anteil an Störsignalen vermutet wird. Aufgrund der Vielfältigkeit möglicher Störsignale haben solche Verfahren jedoch nur einen begrenzten Nut­ zen und darüber hinaus wird auch das Nutzsignal, das üblicherweise ein Sprach­ signal ist, verzerrt und gestört.
Eine weitere Schwierigkeit besteht darin, dass es sich bei der Sprache um ein äußerst komplexes Signal handelt. Es sind verschiedene Modelle der Spracher­ zeugung bekannt, wie etwa in J. L. FLANAGAN: "Speech Analysis, Synthesis and Perception" 2. ed, Springer Verlag, New York 1972. Darin wird ein Grundsignal definiert, das entweder aus einer Reihe von Impulsen besteht, wie dies etwa bei Vokalen der Fall ist oder aus Rauschen beispielsweise bei Konsonanten, wie etwa "S" oder "SCH". Die Impulsreihe definiert die Tonhöhe und ist oft als F0 (Null- Formant) bezeichnet. Ein solches Signal hat zumeist zahlreiche harmonische Komponenten bis zu sehr hohen Frequenzen. Durch das Atmen entsteht zusätz­ lich ein Rauschen. Bei der Artikulation werden die so, erzeugten Signale weiter gefiltert. Dadurch ändert sich die spektrale Form und es entsteht die Sprache. Daraus abgeleitet ist versucht worden, Störschallunterdrückungssysteme zu ent­ wickeln, die auf einer spektralen Analyse beruhen. Da sich jedoch die Sprache ständig ändert, das heißt Amplitude, Frequenz und Spektren nicht konstant sind, sind solchen Verfahren Grenzen gesetzt. Zusätzliche Schwierigkeiten entstehen beispielsweise durch Koartikulationen, die einen Übergang von einem zu einem anderen Phonem darstellen. Im Gegensatz dazu sind Störungen üblicherweise relativ einfachere Signale, was im Übrigen auch für Musik zutrifft.
Eine grundlegende Darstellung, die auch in heutiger Zeit noch zutreffend ist, ist in J. S. LIM, A. V. OPPENHEIM: "Enhancement and Bandwith compression of noisy speech" Proceedings of IEEE Vol. 67, Nr. 12, Dezember 1979 gegeben. Weiters haben in jüngster Zeit Verfahren wie "Beam Forming" und "Blind Source Separation" an Bedeutung gewonnen. Bei solchen Verfahren wird jedoch stets mehr als ein Mikrophon benötigt. Die vorliegende Erfindung betrifft jedoch Verfahren, die auch auf ein aus einem einzigen Mikrophon gewonnenes Signal anwendbar sind.
In der Praxis werden häufig sogenannte "Noise Gates" verwendet, die im Grunde genommen einen oder mehrere parallel geschaltete Expander darstellen. Dabei wird das Eingangssignal verstärkt und parallel mehreren Filtern zugeführt und dadurch in mehrere Frequenzbänder unterteilt. In jedem Kanal wird danach die Amplitude festgestellt, indem der Absolutwert mit einem Tiefpassfilter gefiltert wird, um die durchschnittliche Energie oder Amplitude des Signals zu gewinnen. Danach folgt eine nichtlineare Transformation, die bei digitaler Signalbearbeitung auch mit einer sogenannten "Look up Table", aber auch anders, beispielsweise durch eine geschlossen angegebene Funktion realisierbar ist. Der so gewonnene Wert wird dazu verwendet, das Signal des jeweiligen Kanals zu verstärken bezie­ hungsweise abzuschwächen, das heißt, dass im einfachsten Fall eine Multiplika­ tion stattfindet. Die auf diese Weise gewonnenen Signale jedes Kanals werden addiert, um ein Ausgangssignal zu erzeugen. Eine Expansion des Signals kann auf diese Weise leicht durchgeführt werden, indem dann wenn die Energie, das heißt die Amplitude des Signals, gering ist, das Signal reduziert wird, wogegen bei größerer Amplitude eine Verstärkung vorgenommen wird. In jedem Fre­ quenzbereich werden daher Störungen geringer Amplitude unterdrückt. Solche Systeme funktionieren jedoch nur bei relativ konstanter Störung. Ein weiteres Problem besteht darin, dass auch leise Sprachsignale unterdrückt werden. Ferner werden in Sprechpausen Artefakte generiert, die manchmal sehr störend sind. Insgesamt kann man sagen, dass solche Systeme keine befriedigende Lösung zur Unterdrückung von Störschall bieten können.
Aus der EP 542 710 A (RIBIC) ist ein Verfahren zur Verarbeitung von Signalen bekannt, bei dem aus einem Eingangssignal ein analytisches Signal gewonnen wird. Als analytisches Signal wird ein komplexes Signal bezeichnet, dessen ima­ ginäre Komponente die Hilbert-Transformierte der reellen Komponente darstellt. Die mathematischen Grundlagen davon sind beispielsweise in R. B. RANDALL: "Frequency Analysis" BRÜL & KJAER, 1987 ausführlich beschrieben. In der ge­ nannten Offenlegungsschrift sind verschiedene Möglichkeiten und Schaltungen zu Gewinnung der Hilbert-Signale beschrieben. Durch die derzeitigen Möglichkeiten der digitalen Signalverarbeitung ist es in relativ einfacher Weise möglich einen Hilbert-Transformator zu realisieren, um das reelle und das imaginäre Signal zu gewinnen. Es wird dazu beispielsweise auf S. L. HAHN: "Hilbert Transforms in Signal Processing" Artech House, 1996 verwiesen. Ausgehend von dem analyti­ schen Signal bestehend aus den beiden Hilbert-Signalen, beziehungsweise dem Realteil und dem Imaginärteil, kann ein sogenanntes Instant-Amplitudensignal nach folgender Formel (1) berechnet werden:
IA = (Re2 + Im2)½ (1)
wobei Re den Realteil des analytischen Signals und Im den Imaginärteil des analytischen Signals bezeichnet.
Das Instant-Amplitudensignal stellt einen Wert dar, der die momentane Magni­ tude repräsentiert. Die Magnitude ist die Vektorlänge für komplexe Signale, die Amplitude des Eingangsignals ist in der Zeitdomäne der Momentanwert des Real­ teils des analytischen Signals. Gemäß der folgenden Formel (2) wird in analoger Weise ein Instant-Phasensignal berechnet:
IFI = arctan(Im/Re) (2)
wobei IFI einen Wert darstellt, der als momentane Phase des Signals angesehen werden kann.
Aus der oben genannten EP 542 711 A ist ein Verfahren bekannt, mit dem Audio­ signale bearbeitet werden können, um die Funktion von Hörgeräten zu verbes­ sern. Dabei wird aus einem Eingangssignal ein analytisches Signal erzeugt, aus dem ein Instant-Amplitudensignal berechnet wird. Dieses Instant-Amplitudensig­ nal wird als Stellgröße verwendet, um das Eingangssignal oder eines der Hilbert- Signale passend zu verstärken, so dass eine Signalkompression erreicht wird. Es wird also das Instant-Amplitudensignal nur dazu verwendet, das Eingangssignal entsprechend zu bearbeiten. Da jedoch die Verzögerung des Instant-Amplituden­ signals und des damit gesteuerten Signals nicht übereinstimmen, kann eine voll­ ständig befriedigende Lösung nicht erreicht werden.
Auch die US 4,495,443 A (ORBAN) und die US 6,205,225 B (ORBAN) zeigen Verfahren, die durch eine Hilbert-Transformation zunächst ein analytisches Signal erzeugen. In den obigen Schaltungen werden die Hilbert-Signale jedoch vor der weiteren Verarbeitung gefiltert, so dass ein echtes Instant-Amplitudensignal nicht erhalten werden kann. Mit solchen Verfahren können Signalspitzen be­ grenzt werden, es ist jedoch nicht möglich, Störschall insgesamt wirksam zu un­ terdrücken.
Aufgabe der vorliegenden Erfindung ist es, ein Verfahren der oben beschriebenen Art anzugeben, bei dem Störschall wirksam unterdrückt werden kann. Insbeson­ dere soll ein solches Verfahren eine leichte Einstellbarkeit und Anpassung an verschiedenste Umgebungsbedingungen ermöglichen, wobei im Fall von Hörge­ räten auch der spezifische Hörverlust der jeweiligen Person zu berücksichtigen ist.
Erfindungsgemäß ist vorgesehen, dass die Schritte des Patentanspruches 1 aus­ geführt werden. Wesentlich an der vorliegenden Erfindung ist, dass das Instant- Amplitudensignal nicht wie beim Stand der Technik lediglich zur Steuerung oder Bearbeitung des Eingangssignals verwendet wird, sondern dass das Amplituden­ signal selbst modifiziert wird und mit einem Instant-Phasensignal zu einem Aus­ gangssignal zusammengesetzt wird. Wesentlich ist weiters, dass die zusammen­ gesetzten Signale die gleiche Verzögerung aufweisen, so dass Verzerrungen mi­ nimiert werden können.
Die erfindungsgemäße Lösung bringt besondere Vorteile gegenüber dem Stand der Technik, wenn das analytische Signal durch zwei Allpassfilter erzeugt wird. Bei der bekannten Lösung entstehen in diesem Fall Phasenverzerrungen, die nicht korrekte Ergebnisse bringen. Auch für die Systemintegration, bei der meh­ rere Methoden in eine Schaltung bzw. einen Algorithmus integriert werden, ist die erfindungsgemäße Synthese vorteilhaft.
Das Ausgangssignal Sout wird dabei nach folgender Formel (3) berechnet:
Sout = IAmod.cos(IFI) (3)
mit IAmod als modifiziertem Instant-Amplitudensignal und IFI als Instant-Phasen­ signal.
Grundsätzlich kann mit dem obigen Verfahren sowohl eine Kompression als auch eine Expansion erreicht werden. Bevorzugt ist es jedoch, wenn zumindest im unteren Pegelbereich die nichtlineare Veränderung des Instant-Amplitudensignals als Expansion ausgebildet ist, das heißt, dass kleine Pegel unterproportional ver­ stärkt oder abgeschwächt werden. Auf diese Weise ist es möglich, leise Störun­ gen in Sprechpausen wirksam zu unterdrücken. Der wesentliche Vorteil des er­ findungsgemäßen Verfahrens besteht darin, dass ein sofortiges Ansprechverhal­ ten erreicht wird, im Vergleich zu herkömmlichen Regelungen, die stets eine ge­ wisse Einschwing- und Ausschwingzeit benötigen. Dies stellt einen wesentlichen Vorteil der Erfindung dar.
Es ist klar, dass mit einer fix eingestellten Modifikation des Instant-Amplituden­ signals eine optimale Anpassung nur an vorbestimmte Umgebungsbedingungen möglich ist. Eine adaptive Regelung, die eine Anpassung an verschiedenartige Umweltzustände ermöglicht, kann gemäß Anspruch 3 erreicht werden. Dies be­ deutet, dass das Eingangssignal analysiert wird und aufgrund dieser Analyse die Art der Modifikation des Instant-Amplitudensignals verändert wird. Die Bewer­ tung wird dabei beispielsweise in der Weise erfolgen, dass zunächst herausge­ funden wird, ob ein Sprachsignal vorliegt oder nicht und welcher Art ein mögli­ ches Störsignal ist. In Abhängigkeit von dieser Analyse wird die Modifikation des Instant-Amplitudensignals durchgeführt, wobei beispielsweise bei Abwesenheit eines Sprachsignals generell eine Abschwächung durchgeführt wird, wogegen bei Anwesenheit eines Sprachsignals nach Art der vorliegenden Störung eine ent­ sprechende Bearbeitung vorgesehen wird.
Eine besonders schnelle und zuverlässige Bewertung kann gemäß Anspruch 4 erreicht werden. Die Grundidee dabei ist, dass die Sprache als Nutzsignal be­ stimmte harmonische Strukturen aufweist, die zur Unterscheidung zwischen Sprachsignalen und Störsignalen dienen können. dabei wurde festgestellt, dass Sprachsignale eine relativ hohe Korrelation des erfindungsgemäß gebildeten In­ stant-Amplitudensignals zum Instant-Frequenzsignal haben. Daraus kann eine Bewertungsfunktion abgeleitet werden, die einen Bewertungsindex ausgibt, der eine Aussage über das Vorliegen von Nutzsignalen (Sprache und Störsignalen) ermöglicht. Im einfachsten Fall kann der Bewertungsindex lediglich zwei Werte wie etwa 0 und 1 angeben, die für Störsignal beziehungsweise Sprachsignal ste­ hen. In verfeinerten Ausführungen ist es möglich, mehrere Ausgabewerte den Bewertungsindex vorzusehen oder einen kontinuierlichen Wertebereich bei­ spielsweise zwischen 0 und 1 zu definieren, wobei der Wert des Bewertungsindex die Wahrscheinlichkeit des Vorliegens von Sprachsignalen beziehungsweise Stör­ signalen angibt oder bei vermischten Signalen ein Maß für den Anteil der jeweili­ gen Signalkomponenten darstellt. Die zeitliche Ableitung des Phasensignals IFI ist exakt ein Kreisfrequenzsignal IW, das nach Division durch 2π das eigentliche Frequenzsignal IFR ergibt.
Eine besonders einfache Durchführung des Verfahrens ergibt sich gemäß An­ spruch 5. Aufgrund der hohen Korrelation von IA und IW bei Sprachsignalen wird sich das Verhältnis IA/IW bei solchen Signalen in einem relativ engen Bereich bewegen. Ist das Verhältnis wesentlich kleiner oder wesentlich größer, so kann daraus geschlossen, dass ein Störsignal dominiert. Der Bewertungsindex n kann analytisch beispielsweise nach einer Formel n = exp(-(k - IA/IW)2) berechnet werden, mit einem empirisch bestimmten Proportionalitätsfaktor k, wobei n = 1 exakte Proportionalität, also Sprachsignal, bedeutet und n << 1 kein Sprachsig­ nal.
Durch die nichtlinearen Modifikationen des Instant-Amplitudensignals und des Instant-Frequenzsignals kann eine schärfere Unterscheidung gewonnen werden.
Eine weitere Schärfung der Unterscheidung kann dadurch gewonnen werden, dass die Schritte gemäß Anspruch 6 durchgeführt werden. Dies bedeutet, dass nicht nur das Verhältnis von IA zu IW sondern auch das Verhältnis der zeitlichen Ableitungen dieser Signale berücksichtigt wird, da bei Sprachsignalen auch die Ableitungen miteinander korreliert sind. Der Bewertungsindex wird dann einen großen Wert aufweisen, wenn sowohl die Korrelation der Signale selbst als auch die Korrelation ihrer Ableitungen gegeben ist. Zu diesem Zweck werden die ent­ sprechenden Teilbewertungsindizes additiv verknüpft. Es ist dabei möglich, die eine oder die andere Teilbewertungsfunktion bei der Summenbildung stärker zu gewichten, wobei die entsprechenden Gewichte gemäß den jeweilig herrschenden Umständen durch Versuche leicht ermittelbar sind. Generell ist es vorteilhaft, die differenzierten Signale stärker zu gewichten, indem beispielsweise der erste Teil­ bewertungsindex mit w und der zweite Teilbewertungsindex mit (1 - w) multipli­ ziert wird, wobei w beispielsweise zwischen 0,2 und 0,4 betragen kann.
Das Verfahren nach Anspruch 6 kann im Sinne einer bevorzugten Ausführung weitergebildet werden, wie dies in den Ansprüchen 7 und 8 definiert ist.
Eine besonders bevorzugte Ausführungsvariante der Erfindung ist gemäß Patent­ anspruch 10 gegeben. Es hat sich überraschenderweise herausgestellt, dass ein Kennfeld, in dem die Wahrscheinlichkeitsdichte des Auftretens bestimmter Kom­ binationen von Instant-Amplitudensignal und Instant-Frequenzsignal dargestellt ist, für Sprache im Gegensatz zu sonstigen Signalen eine charakteristische Form aufweist. Zunächst zerfällt das Kennfeld grundsätzlich in einen Bereich positiver Werte der Instant-Frequenz und in einen Bereich negativer Instant-Frequenz. Für die Beurteilung ist nur der erste Bereich relevant. Überrachenderweise hat sich herausgestellt, dass bei Sprachsignalen in dem positiven Bereich zwei lokale Ma­ xima vorliegen, von denen eines gleichzeitig das absolute Maximum ist. Die Wahrscheinlichkeitsdichte weist somit eine zweihöckerige Struktur auf. Interes­ santerweise ist diese Struktur weitgehend unabhängig von der gesprochenen Sprache und der sprechenden Person. Aufgrund dieser Erkenntnis kann aus dem Kennfeld auf das Vorliegen oder Nicht-Vorliegen von Sprache geschlossen wer­ den.
Zur Erhöhung der Trennschärfe ist es vorteilhaft, wenn gemäß Anspruch 12 das Eingangssignal amplitudenmäßig zunächst normalisiert wird. Dies erfolgt in be­ kannter Weise mit einem AVC-Glied mit relativ langer Zeitkonstante, was be­ wirkt, dass der Durchschnittspegel der Amplitude im Mittel im Wesentlichen kon­ stant ist. Dieser Vorgang wird auch als langsame Kompression bezeichnet. In sprachlicher Hinsicht werden dabei die Vokale eher unterdrückt, während die Konsonanten verstärkt werden.
In kurzfristiger Hinsicht jedoch liegt eine Proportionalität zwischen der Instant- Amplitude und der Instant-Frequenz vor, wie dies oben beschrieben ist. Der Pro­ portionalitätsfaktor ist jedoch im Zeitablauf veränderlich.
Eine besonders günstige Ausbildung des erfindungsgemäßen Verfahrens ist in Anspruch 14 gegeben. Auf diese Weise ist es insbesondere möglich, relativ stati­ sche, schmalbandige Störungen wirksam zu unterdrücken. Im Prinzip könnte an Stelle der Verzögerung von IA und IFI auch das Originalsignal direkt verzögert werden. Dabei ergeben sich jedoch die oben beschriebenen Nachteile, insbeson­ dere bei Verwendung von Allpassfiltern zur Erzeugung des analytischen Signals. Außerdem sind Hilberttransformatoren sind nie perfekt, weil sie nicht kausal sind. Bei einem theoretisch perfekten Transformator wäre die notwendige Verzögerung unendlich lang, was in der Praxis unbrauchbar ist. Daher ist es angezeigt, die Verzögerung im Bereich der komplexen Amplitude und Frequenz durchzuführen. Dann sind die Fehler der Hilberttransformation für beide Signale gleich, und kompensieren sich im Wesentlichen.
Dieses Verfahren ist besonders gut geeignet, ein relativ konstantes Störsignal auszufiltern. Vorzugsweise erfolgt diese Filterung durch ein Verfahren nach An­ spruch 15. dabei wird folgende Formel (4) verwendet:
Sout = Sdel - n.Sint (4)
Der Faktor n liegt gemäß Anspruch 16 zwischen 0 und 1 und bestimmt das Aus­ maß, in dem die statische Komponente abgeschwächt wird, um als Ausgangssig­ nal die dynamische Komponente zu erhalten. Es hat sich gezeigt, dass auf diese Weise auch Störungen wirksam ausgefiltert werden können, die wesentlich grö­ ßer sind als das Nutzsignal selbst. Dazu ist erforderlich, den Faktor n relativ groß zu wählen, das heißt, dass dieser Faktor nahe bei 1 liegt. In dem Fall, dass je­ doch eine sehr geringe Störung vorliegt, wird auf diese Weise das Nutzsignal selbst in unerwünschter Weise verzerrt. Durch die in Anspruch 16 angegebene Maßnahme kann auf einfache Weise dieses Problem behoben werden, da sich herausgestellt hat, dass das Verhältnis der Signalstärke des integrierten Aus­ gangssignals zum verzögerten Ausgangsignal ein sehr gutes Maß dafür ist, wie groß eine unerwünschte statische Komponente ist.
Eine zusätzliche Verbesserung kann gemäß Anspruch 17 erreicht werden. Je nach Anzahl der Frequenzbänder können dabei verschiedenartige statische Signale selektiert ausgefiltert werden.
Weiters betrifft die Erfindung eine Vorrichtung zur Signalbearbeitung zur Durch­ führung eines der oben beschriebenen Verfahren.
In der Folge wird die vorliegende Erfindung anhand der in den Figuren darge­ stellten Ausführungsbeispiele näher erläutert.
Es zeigen
Fig. 1 und 2 Blockdiagramme von Schaltungen, die bei der vorliegenden Erfin­ dung verwendet werden,
Fig. 3 ein Blockdiagramm einer einfachen Vorrichtung zur Unterdrückung von Störschall,
Fig. 4a, 4b, 4c Diagramme, die die Expansion von Signalen erläutern,
Fig. 5, 6 und 7 Blockdiagramme von weiteren Vorrichtungen zur Unterdrückung von Störschall,
Fig. 8 verschiedene Diagramme, die die Wirksamkeit der Unterdrückung von Störschall zeigen,
Fig. 9 und 10 weitere Blockdiagramme von Vorrichtungen zur Unterdrückung von Störschall,
Fig. 11 und 12 Blockdiagramme von Schaltungen zum Erkennen von Sprachsig­ nalen,
Fig. 13 und 14 Diagramme, die die Wirkung von Schaltungen zur Erkennung von Sprachsignalen erläutern,
Fig. 15 ein dreidimensionales Diagramm in axonometrischer Darstellung, das ein Kennfeld der Wahrscheinlichkeitsdichte von Instant-Ampitude und Instant-Fre­ quenz für Sprache darstellt,
Fig. 16 das Kennfeld von Fig. 15 in einer Schichtliniendarstellung,
Fig. 17 ein Diagramm analog zu Fig. 15 für Störsignale, und
Fig. 18 das Diagramm von dem Kennfeld in Fig. 17 in einer Schichtliniendarstel­ lung.
In Fig. 1 ist eine allgemeine Schaltung gezeigt, in der aus einem Eingangssignal ein Instant-Amplitudensignal IA, ein Instant-Phasensignal IFI und ein Instant- Kreisfrequenzsignal IW gewonnen wird. In einem ersten Block 1 wird das Ein­ gangssignal Sin in ein analytisches Signal umgewandelt, das aus einem Realteil Re und einem Imaginärteil Im besteht. Da der Realteil und der Imaginärteil einen konstanten Phasenunterschied von π/2 aufweisen, stellt der Imaginärteil Im die Hilbert-Transformierte des Realteils Re dar. Diese Signale Re und Im werden somit auch als Hilbert-Signale beizeichnet. Möglichkeiten zur Gewinnung des analytischen Signals sind in der EP 542 710 A beschrieben. Im Wesentlichen kann man das Eingangssignal Sin einer Hilbert-Transformation unterziehen, um beispielsweise zum Imaginärteil Im zu kommen. Da die Hilbert-Transformation mit einer Verzögerung verbunden ist, muss das Eingangssignal Sin ebenfalls ver­ zögert werden, um den Realteil Re zu erhalten. Eine alternative Möglichkeit be­ steht darin, das Eingangssignal Sin durch zwei unterschiedliche Allpassfilter in zwei Hilbert-Signale umzuwandeln. Eine weitere Möglichkeit zum Erhalten des analytischen Signals besteht darin, durch eine Fourier-Transformation ein kom­ plexes Spektrum des Eingangssignals Sin zu erhalten, alle Linien um π/2 zu ver­ schieben und das Signal durch inverse Transformation wieder in die Zeitdomäne zurückzusetzen. Durch die Möglichkeiten der digitalen Signalbearbeitung ist es unproblematisch, ein solches analytisches Signal in geeigneter Weise zu erhalten. In den Blöcken 2 und 3 wird gemäß den obigen Formeln (1) und (2) das Instant- Amplitudensignal IA beziehungsweise das Instant-Phasensignal IFI erhalten. Durch zeitliche Ableitung des Instant-Phasensignals IFI in Block 4 kann das In­ stant-Kreisfrequenzsignal IW gebildet werden. Es muss festgehalten werden, dass die Signale IA, IFI und IW abgesehen von der Verzögerung durch die Hil­ bert-Transformation Echtzeitparameter sind, die frei von Mittelungen oder Verzö­ gerungen sind. Die Instant-Amplitude IA ist stets nichtnegativ, wogegen das In­ stant-Kreisfrequenzsignal IW nicht notwendigerweise positiv ist. Da das Instant- Phasensignal im Wesentlichen einen Winkel definiert, kann es durch das soge­ nannte Wraping auf einen Bereich zwischen 0 und 2π oder auf einem Bereich zwischen -π und π eingeschränkt werden.
In Fig. 2 sind die einzelnen Bearbeitungsschritte von Fig. 1 in einem einzigen Block 5 zusammengefasst, um die Darstellung in weiterer Folge zu vereinfachen.
Störungen geringer Amplitude können in allgemeiner Form durch eine Schaltung gemäß Fig. 3 unterdrückt werden. Dabei wird das Instant-Amplitudensignal IA aus dem Block 5 in einer Look up Table einer nichtlinearen Veränderung unterzo­ gen, wodurch ein modifiziertes Instant-Amplitudensignal IAmod erzeugt wird. An Stelle einer Look up Table kann auch eine geschlossen angegebene Funktion oder dgl. zur Erzeugung von IAmod verwendet werden. In einer Verknüpfungs­ schaltung 7 wird das Ausgangssignal Sout aus dem modifizierten Instant-Amplitu­ densignal IAmod und dem Instant-Phasensignal IFI aus der oben beschriebenen Formel (3) berechnet.
In Fig. 4a, 4b und 4c sind drei verschiedene Varianten dargestellt, wie das In­ stant-Amplitudensignal IA durch nichtlineare Transformation zu dem modifizier­ ten Instant-Amplitudensignal IAmod umgewandelt werden kann.
In allen drei Diagrammen ist oberhalb eines vorbestimmten Grenzwerts IAlim des Instant-Amplitudensignals IA eine direkte Proportionalität zwischen IAmod und IA gegeben. Unterhalb dieses Grenzwerts IAlim ist IAmod kleiner als es der Proportio­ nalität entspricht. Bei der Ausführungsvariante von Fig. 4a ist eine Beziehung zwischen IAmod und IA durch gerade Kurvenabschnitte 101, 102, 103 gegeben, wobei der Kurvenabschnitt 101 die geringste Abschwächung bedeutet, wogegen der Kurvenabschnitt 103 bedeutet, dass IAmod für Werte unterhalb von IAlim auf Null gesetzt ist. Bei der Ausführungsvariante von Fig. 4b gibt es einen Über­ gangsbereich unmittelbar unterhalb von IAlim und daran anschließend Kurvenab­ schnitte 104, 105, 106, die parallel zum proportionalen Bereich 100 sind. Bei der Ausführungsvariante von Fig. 4c setzt sich der proportionale Bereich 100 unter­ halb von IAlim in Kurven 107, 108 fort, die eine größere Steigung aufweisen. Die Darstellungen in Fig. 4a, 4b, 4c sind schematisch, und es können die dargestell­ ten Kurven auch auf eine logarithmische Darstellung von IAmod oder IA angewen­ det werden, um zu einer üblichen dB-Skala zu gelangen.
Fig. 5 zeigt eine erweiterte Ausführungsvariante ausgehend von der Lösung von Fig. 3, wobei die nichtlineare Bearbeitung des Instant-Amplitudensignals IA in Abhängigkeit von einer Bewertung des Eingangssignals Sin in Block 8 verändert wird. Das Ergebnis des Bewertungsblocks 8 wird als Steuersignal der Look up Table 9 zugeführt. das Ausgangssignal Sout wird wie zuvor in dem Block 7 aus IAmod und IFI gebildet.
Fig. 6 zeigt eine dreikanalige Lösung, bei der das Eingangssignal Sin durch ein Hochpassfilter 10, ein Bandpassfilter 11 und ein Tiefpassfilter 12 in drei verschie­ dene Frequenzbänder unterteilt wird, die in getrennten Kanälen weiter bearbeitet werden. Alternativ können auch drei oder mehr Bandpassfilter verwendet wer­ den, um beliebig viele Kanäle darzustellen.. Mit 13, 14, 15 sind jedem Kanal Signalbearbeitungsschaltungen zugeordnet, die der Ausführungsvariante von Fig. 3 oder von Fig. 5 entsprechen. Verstärker 16, 17, 18 verstärken die Signale jedes Kanals, und in einem Addierglied 19 werden die Signale der einzelnen Ka­ näle zu einem Ausgangssignal Sout aufaddiert. Die Verbesserung der Schaltung von Fig. 6 gegenüber den zuvor beschriebenen Schaltungen besteht darin, dass anstelle einer breitbandigen und frequenzunabhängigen Regelung eine selektive Regelung in einzelnen Frequenzbereichen erfolgt. Auf diese Weise kann das so­ genannte Atmen der Regelung unterdrückt werden, das im praktischen Betrieb bisweilen störbar ist. Außerdem ergibt sich bei Hörgeräten eine verbesserte An­ passungsmöglichkeit an den spezifischen Hörverlust.
Die Schaltung von Fig. 7 ist besonders dazu ausgelegt, schmalbandige Störungen zu unterdrücken. In den Blöcken 20 und 21 wird zunächst das Instant-Amplitu­ densignal IA bzw. das Instant-Phasensignal IFI in der Frequenzdomäne einer zeitlichen Mittelung unterzogen und anschließend integriert. Dies kann bei digitaler Signalbearbeitung in einfacher Weise dadurch erfolgen, dass die Signale IA und IFI im aktuellen Zeitpunkt t und zu den k unmittelbar zurückliegenden Zeitpunkten t - 1, t - 2 . . . t - k gemittelt werden, um das integrierte Instant- Amplitudensignal IAint und das integrierte Instant-Phasensignal IFIint zu erhalten. In dem Block 7a werden diese Signale gemäß der folgenden Formel (3a) zu einem integrierten Ausgangssignal Sint zusammengesetzt.
Sint = IAint.cos(IFIint) (3a)
Parallel dazu werden das Instant-Amplitudensignal IA bzw. das Instant-Phasen­ signal IFI in den Blöcken 22 und 23 um eine Zeitdauer verzögert, die der Verzö­ gerung entspricht, die durch die Mittelwertbildung in den Blöcken 20 und 21 ver­ ursacht ist. Bei der oben beschriebenen Mittelung beträgt die Verzögerung k/2. Auf diese Weise werden das verzögerte Instant-Amplitudensignal IAdel bzw. das verzögerte Instant-Phasensignal IFIdel gebildet.
In dem Block 7b werden diese Signale gemäß der folgenden Formel (3b) zu ei­ nem verzögerten Ausgangssignal Sdel zusammengesetzt.
Sdel = IAdel.cos(IFIdel) (3b)
In einem Subtraktionsglied 24 wird von dem verzögerten Ausgangssignal Sdel das integrierte Ausgangssignal Sint ganz oder teilweise subtrahiert, um das Aus­ gangssignal Sout zu erhalten, das auf diese Weise die dynamische Komponente des Eingangssignals Sin darstellt.
Durch die Schaltung von Fig. 7 ist es mit sehr gutem Erfolg möglich relativ kon­ stante, schmalbandige Störungen auszufiltern, d. h. Störsignale, deren Frequenz und Amplitude sich nur langsam ändert. Dabei ist es durchaus möglich, dass das Störsignal wesentlich größer als das Nutzsignal ist.
Es hat sich herausgestellt, dass die Länge k des Zeitfensters, über dem die Mittelwertbildung erfolgt, kritisch für die Qualität der Signalbearbeitung ist. Da­ her hat eine digitale Signalbearbeitung nach dem oben beschriebenen Algorith­ mus wesentliche Vorteile gegenüber einer analogen Schaltung mit Filtern, da der Wert von k leicht an die jeweiligen Verhältnisse angepasst werden kann.
In Fig. 8 ist die Wirksamkeit der Schaltung nach Fig. 7 aufgezeigt. Die Dia­ gramme von Fig. 8 zeigen Signale jeweils für einen Zeitabschnitt von 1,5 Sekun­ den. Im oberen Diagramm ist ein Eingangssignal Sin gezeigt, das sich aus einem Nutzsignal, nämlich Musik, mit einer Amplitude von etwa 0,1 und einem Störsig­ nal, einem gewobbelten Ton mit einer Amplitude von 5 zusammensetzt. Die Störung ist also um etwa 34 dB größer als das Nutzsignal. Im mittleren Dia­ gramm ist das integrierte Ausgangssignal Sint gezeigt, das die isolierte Störung repräsentiert. Im unteren Diagramm ist das Ausgangssignal Sout aufgetragen, das aus der Differenz des verzögerten Ausgangssignals Sdel und des integrierten Aus­ gangssignals Sint gebildet ist.
In Fig. 9 ist eine dreikanalige Schaltung dargestellt, die gegenüber der von Fig. 7 zwei wesentliche Vorteile besitzt. Zum einen wird das Eingangssignal Sin wie in Fig. 6 durch ein Hochpassfilter 10, ein Bandpassfilter 11 und ein Tiefpassfilter 12 in drei verschiedene Frequenzbänder unterteilt, die in getrennten Kanälen weiter bearbeitet werden. Mit 25, 26, 27 sind in der Fig. 9 Blöcke bezeichnet, die jeweils einer Schaltung von Fig. 7 mit Ausnahme des Subtraktionsglieds 24 entsprechen. An den Ausgängen dieser Blöcke 25, 26, 27 liegt jeweils das verzögerte Aus­ gangssignal Sdel und das integrierte Ausgangssignal Sint für jeden Frequenzbe­ reich an. Auf diese Weise ist es möglich, bis zu drei voneinander unabhängige quasistatische Störungen optimal auszufiltern. Es ist offensichtlich, dass die An­ zahl der Kanäle je nach Bedarf und der verfügbaren Rechenleistung beliebig ge­ wählt werden kann.
Ein weiterer Unterschied der Ausführungsvariante von Fig. 9 zu der oben be­ schriebenen Lösung besteht darin, dass in Bewertungsgliedern 28, 29, 30 die Signale Sdel und Sint für jeden Frequenzbereich analysiert werden. Es hat sich nämlich herausgestellt, dass die Schaltung von Fig. 7 sehr gute Ergebnisse bringt, wenn tatsächlich eine beträchtliche Störung vorliegt. Bei ungestörten Ein­ gangssignalen jedoch wird ebenfalls ein statischer Anteil ausgefiltert, was zu un­ erwünschten Verzerrungen führt. In den Bewertungsgliedern 28, 29, 30 wird ver­ sucht, das Ausmaß der Störung zu erfassen, um eine überschießende Korrektur zu vermeiden. Im einfachsten Fall wird im Wesentlichen das Verhältnis aus dem verzögerten Ausgangssignal Sdel und dem integrierten Ausgangssignal Sint für je­ den Frequenzbereich ermittelt. Dies kann beispielsweise nach folgender Formel (6) erfolgen:
n = f(MASint/(MASdel - MASint)) (6)
Dabei stellt MASint als gemittelter Absolutwert von Sint die statische Komponente und (MASdel - MASint) die dynamische Komponente in dem jeweiligen Kanal dar, wobei MASdel den gemittelten Absolutwert von Sdel bezeichnet. Mit der Bewer­ tungsfunktion f, die durch eine Look up Table realisiert ist, wird ein Bewertungs­ index n berechnet, der zwischen 0 und 1 liegt. Je größer die statische Kompo­ nente MASint im Vergleich zu der dynamischen Komponente (MASdel - MASint) ist, um so näher liegt n bei 1. Umgekehrt wird n für Werte des Verhältnisses (MASint/(MASdel - MASint) unterhalb eines vorbestimmten Grenzwerts mit Null festgelegt. Die Bewertungsfunktion f kann auf empirischem Weg optimiert wer­ den.
Mit dem so bestimmten Bewertungsindex n, der für den ersten Kanal mit na be­ zeichnet ist, kann in den Subtraktionsgliedern 31, 32, 33 für jeden Kanal ein Ausgangssignal berechnet werden. Am Beispiel des ersten Kanals lautet die For­ mel:
Sout1 = Sdel - na.Sint (7)
Aus dieser Formel (7) ist ersichtlich, dass die Korrektur um so größer ist, je größer die statische Komponente ist. Auf diese Weise können Verzerrungen mi­ nimiert und die Entstehung von Artefakten vermieden werden.
Analog zu der Schaltung von Fig. 6 werden in einem Addierglied 19 die Signale der einzelnen Kanäle zu einem Ausgangssignal Sout aufaddiert.
In Fig. 10 ist eine Schaltung dargestellt, die weitgehend der von Fig. 9 ent­ spricht. Es werden daher nur die Unterschiede erklärt. Es werden bei dieser Aus­ führung die verzögerten Ausgangssignale Sdel und die integrierten Ausgangssig­ nale Sint aller Kanäle in den Addiergliedern 19a und 19b addiert. Auf diese Weise erhält man ein verzögertes Ausgangssignal Sdel und ein integriertes Ausgangssig­ nal Sint für alle Kanäle. In dem Bewertungsglied 28 wird wie oben beschrieben die Berechnung nach Formel (6) ausgeführt, und in dem Subtraktionsglied 31 erfolgt die Bestimmung des Ausgangssignal Sout nach Formel (7).
Eine solche Schaltung besitzt einen einfacheren Aufbau und benötigt weniger Re­ chenleistung als die von Fig. 9, wobei jedoch die Unterscheidung zwischen Nutz­ signal und Störung nicht so genau ist.
In den Bewertungsgliedern 28, 29, 30 kann alternativ oder zusätzlich ein Ver­ fahren zur Erkennung von Sprache ausgeführt werden, wie dies in der Folge be­ schrieben ist.
In Fig. 11 ist in allgemeiner Form eine Schaltung zur Erkennung von Störsigna­ len. In dem Block 40 wird eine Normierung der Amplitude durchgeführt, wobei die Zeitkonstanten relativ lang sein sollten. Durch die Normierung wird der Um­ stand ausgeglichen, dass der Pegel der Eingangssignale je nach Entfernung zum Sprecher sehr unterschiedlich sein kann, was die Korrelation, die in der Folge beschrieben wird, stört. Durch die relativ lange Zeitkonstante bleibt jedoch die Dynamik der Sprache erhalten, und Störungen in kürzeren Sprechpausen werden nicht überbetont.
Der Block 5 liefert ein Instant-Amplitudensignal IA, ein Instant-Phasensignal IFI und ein Instant-Kreisfrequenzsignal IW, wie dies zu Fig. 1 und 2 beschrieben worden ist. In Block 41 wird aus dem Instant-Kreisfrequenzsignal IW durch Division durch 2π das Instant-Frequenzsignal IFR berechnet. Daraus und dem Instant-Amplitudensignal IA wird ein Bewertungsindex aus einer Bewertungsbe­ wertungsfunktion errechnet. Die Erkennung von Sprache als Nutzsignal, aber auch in geringerem Umfang von Musik beruht auf der Tatsache, dass bei Vorlie­ gen harmonischer Komponenten eine Korrelation zwischen und dem Instant- Amplitudensignal IA und dem Instant-Frequenzsignal IFR zu beobachten ist. Überraschenderweise liegt jedoch eine solche Korrelation in geringerem Umfang auch bisweilen bei nicht harmonischen Signalen vor, keinesfalls jedoch bei Rau­ schen.
Im einfachsten Fall wird das Verhältnis des Instant-Amplitudensignals IA und dem Instant-Frequenzsignal IFR als Variable für die Bewertungsfunktion heran­ gezogen. Es kann aber auch vor der Bildung des Verhältnisses eine nichtlineare Transformation durchgeführt werden, um ein modifizertes Instant-Amplituden­ signal IAmod bzw. ein modifizertes Instant-Frequenzsignal IFRmod zu erhalten:
IAmod = f(IA) (8)
IFRmod = g(IFR) (9)
Die Bewertungsfunktionen f und g sind nichtlineare, vorzugsweise monotone Funktionen, wie In(x) oder x3, werden jedoch im Allgemeinen durch Look up Tables realsiert, die empirisch ermittelt werden. Dazu werden Signale, die Stö­ rungen unterschiedlichen Typs und die unterschiedliche Sprachanteile aufweisen, hergestellt und gemäß Fig. 11 analysiert. Durch Variation von f und g kann die Korrelation des Bewertungsindex n mit dem tatsächlichen Sprachanteil optimiert werden. Inputgröße der Bewertungsfunktion ist in diesem Fall IAmod/IFRmod.
Eine verbesserte Erkennung ermöglicht die Schaltung gemäß Fig. 12, bei der nicht nur die Korrelation zwischen dem Instant-Amplitudensignal IA und dem In­ stant-Frequenzsignal IFR oder einer dazu ähnlichen Größe in Betracht gezogen wird, um einen ersten Teilbewertungsindex n1 zu erhalten, sondern auch die Korrelation zwischen den zeitlichen Ableitungen IAdiff bzw. IFRdiff. dieser Größen, die in den Differenziergliedern 4a, 4b gebildet werden.
In den Blöcken 43 und 44 wird wie oben beschrieben eine nichtlineare Transfor­ mation durchgeführt werden, um ein modifizertes Instant-Amplitudensignal IAmod bzw. ein modifizertes Instant-Frequenzsignal IFRmod zu erhalten. Nicht darge­ stellt, jedoch möglich, ist eine nichtlineare Transformation der zeitlichen Ablei­ tungen IAdiff bzw. IFRdiff. zu modifizierten Ableitungen IAdiffmod bzw. IFRdiffmod.
Ein erster Teilbewertungsindex wird erhalten, indem in dem Block 41a, der im Wesentlichen ein Multiplikator ist, das modifizerte Instant-Amplitudensignal IAmod bzw. das modifizerte Instant-Frequenzsignal IFRmod miteinander multipliziert wer­ den. Wenn die nichtlinearen Transformationen in den Blöcken 43 und 44 so durchgeführt werden, dass IAmod und IFRmod um den Nullpunkt schwanken, dann ist das Produkt bei hoher Korrelation groß, ansonsten klein.
In dem Block 41b wird in analoger Weise eine zweite Teilbewertungsfunktion aus den Ableitungen berechnet, um einen zweiten Teilbewertungsindex n2 zu erhal­ ten.
Block 41 arbeitet wie oben beschrieben. In den Blöcken 45 und 46 wird eine zeitliche Mittelwertbildung durchgeführt, um geringfügige Phasenunterschiede zwischen den Signalen, die die Korrelation beeinträchtigen, auszugleichen. Da­ durch wird im Wesentlichen eine Kreuzkorrelationsberechnung durchgeführt.
In einem Addierglied 47 werden die Ausgänge der Blöcke 45 und 46 addiert, wo­ bei gegebenenfalls eine Gewichtung durchgeführt werden kann, um den endgül­ tigen Bewertungsindex n zu erhalten. Vorteilhaft ist an dieser Ausführungsvari­ ante, dass die Blöcke 41, 43 und 44 einerseits und 42 andererseits getrennt von­ einander optimiert werden können, was die Bestimmung der Funktionen und Ko­ effizienten erleichtert.
In Fig. 13 ist für ein Signal, das primär aus Sprache besteht, IA und IFR aufge­ tragen. Das Instant-Amplitudensignal IA ist stark verstärkt im oberen Bereich als helle Kurve dargestellt. Darunter ist das Instant-Frequenzsignal IFR dunkle Kurve aufgetragen. Die Korrelation zwischen diesen Signalen ist offensichtlich.
In Fig. 14 ist ein Sprachsignal, das im mittleren Abschnitt dargestellt ist, durch eine starke Störung überlagert, wobei das Summensignal unten hell dargestellt ist. Im oberen Bereich ist der Bewertungsindex n aufgetragen, der gemäß der Schaltung von Fig. 11 ermittelt worden ist.
Es ist umittelbar ersichtlich, dass ein Wert n < 3 nahezu sicher auf die Anwesen­ heit von Sprache schließen lässt, wogegen n < 3 die Abwesenheit eines Sprach­ signals anzeigt. Auf diese Weise ist es möglich, die Verstärkung und die Signal­ bearbeitung zu optimieren. Im einfachsten Fall wird bei Abwesenheit eines Sprachsignals die Verstärkung um ein vorbestimmtes Ausmaß verringert.
In Fig. 15 ist in einer dreidimensionalen Darstellung die Wahrscheinlichkeits­ dichte von Instant-Ampitude und Instant-Kreisfrequenz für ein Sprachsignal dar­ gestellt. Die Instant-Kreisfrequenz nimmt sowohl positive als auch negative Werte an, wobei in der Darstellung der Bereich zwischen -200π und 200π ausge­ nommen ist, da dieser Bereich für die Analyse unbedeutend ist, jedoch Signale in diesem Frequenzbereich eine hohe Energie haben können, insbesondere bei Plosiven, was die Berechnungen unter Umständen stört.
Es ist aus Fig. 15 eine für Sprache typischen zweihügelige Struktur ersichtlich, das heißt, dass in dem Kennfeld zwei lokale Maxima 50 und 51 vorliegen. Dies ist auch aus der Schichtliniendarstellung von Fig. 16 ersichtlich.
Fig. 17 und 18 entsprechen Fig. 15 und 16, jedoch für ein Störsignal ohne Sprachanteil. Im positiven Bereich der Instant-Kreisfrequenz liegt dabei nur ein Hügel vor.

Claims (18)

1. Verfahren zur Unterdrückung von Störschall mit folgenden Schritten:
  • - Gewinnen eines analytischen Signals aus einem Eingangssignal (Sin);
  • - Berechnen eines Instant-Amplitudensignals (IA) aus dem analytischen Signal;
  • - Berechnen eines Instant-Phasensignals (IFI) aus dem analytischen Sig­ nal;
  • - nichtlineares Verändern des Instant-Amplitudensignals (IA) zu einem modifizierten Instant-Amplitudensignal (IAmod);
  • - Verknüpfen des modifizierten Instant-Amplitudensignals (IAmod) mit dem Instant-Phasensignal (IFI) zu einem Ausgangssignal (Sout).
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die nichtline­ are Veränderung des Instant-Amplitudensignals (IA) eine Expansion ist.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die nichtline­ are Veränderung des Instant-Amplitudensignals (IA) aufgrund einer Bewer­ tung des Eingangssignals (Sin) durchgeführt wird.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die Bewer­ tung aufgrund einer Bewertungsfunktion durchgeführt wird, die aus dem In­ stant-Amplitudensignal (IA) und einem durch zeitliche Ableitung des In­ stant-Phasensignals (IFI) gewonnenen Instant-Frequenzsignal (IFR) be­ rechnet wird, um einen Bewertungsindex (n) zu erhalten.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass das Berech­ nen der Bewertungsfunktion durch folgende Schritte erfolgt:
  • - nichtlineares Verändern des Instant-Amplitudensignals (IA) zu einem modifizierten Instant-Amplitudensignal (IAmod);
  • - nichtlineares Verändern des Instant-Frequenzsignals (IFR) zu einem modifizierten Instant-Frequenzsignal (IFRmod);
  • - Berechnen der Bewertungsfunktion aus dem Verhältnis des modifizierten Instant-Amplitudensignals (IAmod) zum modifizierten Instant-Frequenzsig­ nal (IFRmod), um den Bewertungsindex (n) zu erhalten.
6. Verfahren nach einem der Ansprüche 3 bis 5, dadurch gekennzeichnet, dass aus dem Instant-Amplitudensignal (IA) und dem Instant-Frequenzsig­ nal (IFR) ein erster Teilbewertungsindex (n1) gebildet wird, dass aus einer zeitlichen Ableitung des Instant-Amplitudensignals (IA) und einer zeitlichen Ableitung des Instant-Frequenzsignals (IFR) ein zweiter Teilbewertungsin­ dex (n2) gebildet wird und dass der erste und der zweite Teilbewertungsin­ dex (n1 n2) im Wesentlichen additiv verknüpft werden, um den Bewer­ tungsindex (n) zu berechnen.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass das Berech­ nen der ersten Teilbewertungsfunktion durch folgende Schritte erfolgt:
  • - nichtlineares Verändern des Instant-Amplitudensignals (IA) zu einem modifizierten Instant-Amplitudensignal (IAmod);
  • - nichtlineares Verändern des Instant-Frequenzsignals (IFR) zu einem modifizierten Instant-Frequenzsignal (IFRmod);
  • - Berechnen der ersten Teilbewertungsfunktion aus dem Verhältnis des modifizierten Instant-Amplitudensignals (IAmod) zum modifizierten In­ stant-Frequenzsignal (IFRmod), um einen ersten Teilbewertungsindex (n1) zu erhalten.
8. Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, dass das Berechnen der zweiten Teilbewertungsfunktion durch folgende Schritte er­ folgt:
  • - nichtlineares Verändern einer zeitlichen Ableitung des Instant- Amplitudensignals (IA) zu einem modifizierten differenzierten Instant- Amplitudensignal (IAdiffmod);
  • - nichtlineares Verändern einer zeitlichen Ableitung des Instant- Frequenzsignals (IFR) zu einem modifizierten differenzierten Instant-Fre­ quenzsignal (IFIdiffmod);
  • - Berechnen der zweiten Teilbewertungsfunktion aus dem Verhältnis des modifizierten differenzierten Instant-Amplitudensignals (IAdiffmod) zum modifizierten differenzierten Instant-Frequenzsignal (IFIdiffmod), um einen zweiten Teilbewertungsindex (n2) zu erhalten.
9. Verfahren nach einem der Ansprüche 6 bis 8, dadurch gekennzeichnet, dass der zweite Teilbewertungsindex (n2) bei additiven Verknüpfung stärker gewichtet wird als der erste Teilbewertungsindex (n1).
10. Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, dass vorab ein zweidimensionales Kennfeld erstellt wird, in dem für ein Nutzsignal, vor­ zugsweise Sprache, die Wahrscheinlichkeitsdichte als Funktion des Instant- Amplitudensignals (IA) und des Instant-Frequenzsignals (IFI) angegeben ist, und dass die Bewertungsfunktion auf der Basis dieses Kennfelds be­ stimmt wird.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass in dem Kennfeld zwei nicht zusammenhängende Bereiche definiert werden, die dem Nutzsignal zugeordnet werden, und dass der übrige Bereich des Kennfelds dem Störsignal zugeordnet wird.
12. Verfahren nach einem der Ansprüche 3 bis 11, dadurch gekennzeichnet, dass das Eingangssignal (Sin) vorab einer Normalisierung der Amplitude unterzogen wird.
13. Verfahren zur Unterdrückung von Störschall, bei dem ein Eingangssignal (Sin) in mehrere Frequenzbänder unterteilt wird, das Signal jedes Frequenz­ bandes einem Verfahren nach einem der Ansprüche 1 bis 12 unterworden wird, und bei dem die Ausgangssignale (Sout1, Sout2, Sout3) der einzelnen Fre­ quenzbänder zu einem Gesamt-Ausgangssignal (Sout) addiert werden.
14. Verfahren zur Unterdrückung von Störschall mit folgenden Schritten:
  • - Gewinnen eines analytischen Signals aus einem Eingangssignal (Sin);
  • - Berechnen eines Instant-Amplitudensignals (IA) aus dem analytischen Signal;
  • - Berechnen eines Instant-Phasensignals (IFI) aus dem analytischen Sig­ nal;
  • - Bilden eines integrierten Instant-Amplitudensignals (IAint) als zeitlicher Mittelwert des Instant-Amplitudensignals (IA);
  • - Bilden eines integrierten Instant-Phasensignals (IFIint), wobei eine zeitliche Ableitung des Instant-Phasensignals (IFI) gebildet und das Ergebnis zeitlich gemittelt und integriert wird;
  • - Bilden eines verzögerten Instant-Amplitudensignals (IAdel) durch Verzö­ gern des Instant-Amplitudensignals (IA) um eine Verzögerungszeit, die der Verzögerung durch die Mittelwertbildung des Instant-Amplituden­ signals (IA) entspricht;
  • - Bilden eines verzögerten Instant-Phasensignals (IFIdel) durch Verzögern des Instant-Phasensignals (IFI) um eine Verzögerungszeit, die der Verzö­ gerung durch die Mittelwertbildung des Instant-Phasensignals (IFI) ent­ spricht;
  • - Verknüpfen des integrierten Instant-Amplitudensignals (IAint) mit dem in­ tegrierten Instant-Phasensignal (IFIint) zu einem integrierten Ausgangs­ signal (Sint);
  • - Verknüpfen des verzögerten Instant-Amplitudensignals (IAdel) mit dem verzögerten Instant-Phasensignal (IFIdel) zu einem verzögerten Aus­ gangssignal (Sdel);
  • - Verknüpfen des integrierten Ausgangssignals (Sint) mit dem verzögerten Ausgangssignal (Sdel).
15. Verfahren nach Anspruch 14, dadurch gekennzeichnet, dass das Verknüpfen des integrierten Ausgangssignals mit dem verzögerten Aus­ gangssignal durch Subtraktion des mit einem Faktor multiplizierten integ­ rierten Ausgangssignals von dem verzögerten Ausgangssignal erfolgt.
16. Verfahren nach einem der Ansprüche 14 oder 15 dadurch gekennzeich­ net, dass der Faktor zwischen 0 und 1 liegt und aus dem Verhältnis der Signalstärke des integrierten Ausgangssignals (Sint) zum verzögerten Aus­ gangssignal (Sdel) bestimmt wird.
17. Verfahren zur Unterdrückung von Störschall, bei dem ein Eingangssignal in mehrere Frequenzbänder unterteilt wird, das Signal jedes Frequenzbandes einem Verfahren nach einem der Ansprüche 14 bis 16 unterworden wird, und bei dem die Ausgangssignale der einzelnen Frequenzbänder zu einem Gesamt-Ausgangssignal (Sout) addiert werden.
18. Vorrichtung zur Signalbearbeitung zur Durchführung eines Verfahrens nach einem der Ansprüche 1 bis 17, mit einer Schaltung zur Gewinnung eines In­ stant-Amplitudensignals (IA) und eines Instant-Phasensignal (IFI) aus ei­ nem Eingangssignal (Sin), dadurch gekennzeichnet, dass in einem Ver­ knüpfungsglied ein durch nichtlineares Verändern gewonnenes modifiziertes Instant-Amplitudensignal (IAmod) mit dem Instant-Phasensignal (IFI) zu ei­ nem Ausgangssignal (Sout) verknüpft wird.
DE2001137395 2001-07-31 2001-07-31 Verfahren zur Unterdrückung von Störschall Expired - Fee Related DE10137395C1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE2001137395 DE10137395C1 (de) 2001-07-31 2001-07-31 Verfahren zur Unterdrückung von Störschall
US10/210,641 US7092877B2 (en) 2001-07-31 2002-07-31 Method for suppressing noise as well as a method for recognizing voice signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2001137395 DE10137395C1 (de) 2001-07-31 2001-07-31 Verfahren zur Unterdrückung von Störschall

Publications (1)

Publication Number Publication Date
DE10137395C1 true DE10137395C1 (de) 2003-02-13

Family

ID=7693794

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2001137395 Expired - Fee Related DE10137395C1 (de) 2001-07-31 2001-07-31 Verfahren zur Unterdrückung von Störschall

Country Status (1)

Country Link
DE (1) DE10137395C1 (de)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0542710A1 (de) * 1991-11-13 1993-05-19 Viennatone Aktiengesellschaft Verfahren zur Bearbeitung von Signalen
EP0542711A1 (de) * 1991-11-13 1993-05-19 Viennatone Aktiengesellschaft Verfahren zur Verschiebung der Frequenz von Signalen
US6905225B2 (en) * 2003-06-09 2005-06-14 George S. Pearl Floodlight and spotlight adapter and enclosure

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0542710A1 (de) * 1991-11-13 1993-05-19 Viennatone Aktiengesellschaft Verfahren zur Bearbeitung von Signalen
EP0542711A1 (de) * 1991-11-13 1993-05-19 Viennatone Aktiengesellschaft Verfahren zur Verschiebung der Frequenz von Signalen
US6905225B2 (en) * 2003-06-09 2005-06-14 George S. Pearl Floodlight and spotlight adapter and enclosure

Similar Documents

Publication Publication Date Title
DE69627580T2 (de) Verfahren zur Rauschverminderung in einem Sprachsignal
EP0912974B1 (de) Verfahren zur verringerung von störungen eines sprachsignals
DE19747885B4 (de) Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
DE112009000805B4 (de) Rauschreduktion
DE69531710T2 (de) Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen
DE2818204C2 (de) Signalverarbeitungsanlage zur Ableitung eines störverringerten Ausgangssignals
DE69124005T2 (de) Sprachsignalverarbeitungsvorrichtung
DE69632626T2 (de) Adaptiver sprachsignalfilter
DE19948308C2 (de) Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung
DE2719973C2 (de)
DE69630580T2 (de) Rauschunterdrücker und Verfahren zur Unterdrückung des Hintergrundrauschens in einem verrauschten Sprachsignal und eine Mobilstation
EP1258865B1 (de) Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen
EP1647972A2 (de) Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen
DE4330243A1 (de) Sprachverarbeitungseinrichtung
DE2749132A1 (de) Rauschfilter-anordnung
DE2626793A1 (de) Verfahren zur bewertung stimmhafter und stimmloser zustaende eines sprachsignals
WO2001047335A2 (de) Verfahren zur elimination von störsignalanteilen in einem eingangssignal eines auditorischen systems, anwendung des verfahrens und ein hörgerät
DE10157535B4 (de) Verfahren und Vorrichtung zur Reduzierung zufälliger, kontinuierlicher, instationärer Störungen in Audiosignalen
EP1755110A2 (de) Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
DE60033039T2 (de) Vorrichtung und verfahren zur unterdrückung von zischlauten unter verwendung von adaptiven filteralgorithmen
DE10137685C1 (de) Verfahren zum Erkennen des Vorliegens von Sprachsignalen
EP1453355B1 (de) Signalverarbeitung in einem Hörgerät
DE10137395C1 (de) Verfahren zur Unterdrückung von Störschall
DE3230391C2 (de)
DE10025655B4 (de) Verfahren zum Entfernen einer unerwünschten Komponente aus einem Signal und System zum Unterscheiden zwischen unerwünschten und erwünschten Signalkomponenten

Legal Events

Date Code Title Description
8100 Publication of the examined application without publication of unexamined application
8304 Grant after examination procedure
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: INTERTON ELECTRONIC HOERGERAETE GMBH, 51469 BE, DE

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee