DE10137395C1 - Verfahren zur Unterdrückung von Störschall - Google Patents
Verfahren zur Unterdrückung von StörschallInfo
- Publication number
- DE10137395C1 DE10137395C1 DE2001137395 DE10137395A DE10137395C1 DE 10137395 C1 DE10137395 C1 DE 10137395C1 DE 2001137395 DE2001137395 DE 2001137395 DE 10137395 A DE10137395 A DE 10137395A DE 10137395 C1 DE10137395 C1 DE 10137395C1
- Authority
- DE
- Germany
- Prior art keywords
- signal
- instant
- ifi
- amplitude
- modified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000004048 modification Effects 0.000 title abstract description 6
- 238000012986 modification Methods 0.000 title abstract description 6
- 230000001629 suppression Effects 0.000 title description 6
- 238000011156 evaluation Methods 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 24
- 230000003111 delayed effect Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 12
- 238000012935 Averaging Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 2
- 239000000654 additive Substances 0.000 claims 1
- 230000000996 additive effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 16
- 230000009466 transformation Effects 0.000 description 11
- 230000003068 static effect Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000005534 acoustic noise Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 206010011878 Deafness Diseases 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010370 hearing loss Effects 0.000 description 2
- 231100000888 hearing loss Toxicity 0.000 description 2
- 208000016354 hearing loss disease Diseases 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000029058 respiratory gaseous exchange Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 101150107341 RERE gene Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003754 machining Methods 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zur Unterdrückung von Störschall mit folgenden Schritten: DOLLAR A - Gewinnen eines analytischen Signals aus einem Eingangssignal (S¶in¶); DOLLAR A - Berechnen eines Instant-Amplitudensignals (IA) aus dem analytischen Signal; DOLLAR A - Berechnen eines Instant-Phasensignals (IFI) aus dem analytischen Signal; DOLLAR A - nichtlineares Verändern des Instant-Amplitudensignals (IA) zu einem modifizierten Instant-Amplitudensignal (IA¶mod¶); DOLLAR A - Verknüpfung des modifizierten Instant-Amplitudensignals (IA¶mod¶) mit dem Instant-Phasensignal (IFI) zu einem Ausgangssignal (S¶out¶).
Description
Die Erfindung betrifft ein Verfahren zur Unterdrückung von Störschall.
Die Entwicklung von Hörgeräten ist in den letzten Jahren so weit perfektioniert
worden, dass technische Probleme nahezu ausgeschlossen beziehungsweise un
bedeutend sind. Nach wie vor drängend ist jedoch das Problem, die Signale bei
der Verstärkung so zu bearbeiten, dass die Nutzsignale möglichst verlustfrei
übertragen werden und die Störsignale so weit als möglich unterdrückt werden.
Aber auch bei anderen Anwendungen, wie etwa im Bereich der Nachrichtenüber
tragung über Telefonleitungen oder per Funk ist die Unterdrückung von Stör
schall ein wichtiges Thema.
Ein einfacher Ansatz besteht darin, durch Anwendung von Hochpassfiltern, Tief
passfiltern oder Bandpassfiltern bestimmte Frequenzbereiche abzuschwächen, in
denen ein hoher Anteil an Störsignalen vermutet wird. Aufgrund der Vielfältigkeit
möglicher Störsignale haben solche Verfahren jedoch nur einen begrenzten Nut
zen und darüber hinaus wird auch das Nutzsignal, das üblicherweise ein Sprach
signal ist, verzerrt und gestört.
Eine weitere Schwierigkeit besteht darin, dass es sich bei der Sprache um ein
äußerst komplexes Signal handelt. Es sind verschiedene Modelle der Spracher
zeugung bekannt, wie etwa in J. L. FLANAGAN: "Speech Analysis, Synthesis and
Perception" 2. ed, Springer Verlag, New York 1972. Darin wird ein Grundsignal
definiert, das entweder aus einer Reihe von Impulsen besteht, wie dies etwa bei
Vokalen der Fall ist oder aus Rauschen beispielsweise bei Konsonanten, wie etwa
"S" oder "SCH". Die Impulsreihe definiert die Tonhöhe und ist oft als F0 (Null-
Formant) bezeichnet. Ein solches Signal hat zumeist zahlreiche harmonische
Komponenten bis zu sehr hohen Frequenzen. Durch das Atmen entsteht zusätz
lich ein Rauschen. Bei der Artikulation werden die so, erzeugten Signale weiter
gefiltert. Dadurch ändert sich die spektrale Form und es entsteht die Sprache.
Daraus abgeleitet ist versucht worden, Störschallunterdrückungssysteme zu ent
wickeln, die auf einer spektralen Analyse beruhen. Da sich jedoch die Sprache
ständig ändert, das heißt Amplitude, Frequenz und Spektren nicht konstant sind,
sind solchen Verfahren Grenzen gesetzt. Zusätzliche Schwierigkeiten entstehen
beispielsweise durch Koartikulationen, die einen Übergang von einem zu einem
anderen Phonem darstellen. Im Gegensatz dazu sind Störungen üblicherweise
relativ einfachere Signale, was im Übrigen auch für Musik zutrifft.
Eine grundlegende Darstellung, die auch in heutiger Zeit noch zutreffend ist, ist
in J. S. LIM, A. V. OPPENHEIM: "Enhancement and Bandwith compression of noisy
speech" Proceedings of IEEE Vol. 67, Nr. 12, Dezember 1979 gegeben. Weiters
haben in jüngster Zeit Verfahren wie "Beam Forming" und "Blind Source
Separation" an Bedeutung gewonnen. Bei solchen Verfahren wird jedoch stets
mehr als ein Mikrophon benötigt. Die vorliegende Erfindung betrifft jedoch
Verfahren, die auch auf ein aus einem einzigen Mikrophon gewonnenes Signal
anwendbar sind.
In der Praxis werden häufig sogenannte "Noise Gates" verwendet, die im Grunde
genommen einen oder mehrere parallel geschaltete Expander darstellen. Dabei
wird das Eingangssignal verstärkt und parallel mehreren Filtern zugeführt und
dadurch in mehrere Frequenzbänder unterteilt. In jedem Kanal wird danach die
Amplitude festgestellt, indem der Absolutwert mit einem Tiefpassfilter gefiltert
wird, um die durchschnittliche Energie oder Amplitude des Signals zu gewinnen.
Danach folgt eine nichtlineare Transformation, die bei digitaler Signalbearbeitung
auch mit einer sogenannten "Look up Table", aber auch anders, beispielsweise
durch eine geschlossen angegebene Funktion realisierbar ist. Der so gewonnene
Wert wird dazu verwendet, das Signal des jeweiligen Kanals zu verstärken bezie
hungsweise abzuschwächen, das heißt, dass im einfachsten Fall eine Multiplika
tion stattfindet. Die auf diese Weise gewonnenen Signale jedes Kanals werden
addiert, um ein Ausgangssignal zu erzeugen. Eine Expansion des Signals kann
auf diese Weise leicht durchgeführt werden, indem dann wenn die Energie, das
heißt die Amplitude des Signals, gering ist, das Signal reduziert wird, wogegen
bei größerer Amplitude eine Verstärkung vorgenommen wird. In jedem Fre
quenzbereich werden daher Störungen geringer Amplitude unterdrückt. Solche
Systeme funktionieren jedoch nur bei relativ konstanter Störung. Ein weiteres
Problem besteht darin, dass auch leise Sprachsignale unterdrückt werden. Ferner
werden in Sprechpausen Artefakte generiert, die manchmal sehr störend sind.
Insgesamt kann man sagen, dass solche Systeme keine befriedigende Lösung
zur Unterdrückung von Störschall bieten können.
Aus der EP 542 710 A (RIBIC) ist ein Verfahren zur Verarbeitung von Signalen
bekannt, bei dem aus einem Eingangssignal ein analytisches Signal gewonnen
wird. Als analytisches Signal wird ein komplexes Signal bezeichnet, dessen ima
ginäre Komponente die Hilbert-Transformierte der reellen Komponente darstellt.
Die mathematischen Grundlagen davon sind beispielsweise in R. B. RANDALL:
"Frequency Analysis" BRÜL & KJAER, 1987 ausführlich beschrieben. In der ge
nannten Offenlegungsschrift sind verschiedene Möglichkeiten und Schaltungen zu
Gewinnung der Hilbert-Signale beschrieben. Durch die derzeitigen Möglichkeiten
der digitalen Signalverarbeitung ist es in relativ einfacher Weise möglich einen
Hilbert-Transformator zu realisieren, um das reelle und das imaginäre Signal zu
gewinnen. Es wird dazu beispielsweise auf S. L. HAHN: "Hilbert Transforms in
Signal Processing" Artech House, 1996 verwiesen. Ausgehend von dem analyti
schen Signal bestehend aus den beiden Hilbert-Signalen, beziehungsweise dem
Realteil und dem Imaginärteil, kann ein sogenanntes Instant-Amplitudensignal
nach folgender Formel (1) berechnet werden:
IA = (Re2 + Im2)½ (1)
wobei Re den Realteil des analytischen Signals und Im den Imaginärteil des
analytischen Signals bezeichnet.
Das Instant-Amplitudensignal stellt einen Wert dar, der die momentane Magni
tude repräsentiert. Die Magnitude ist die Vektorlänge für komplexe Signale, die
Amplitude des Eingangsignals ist in der Zeitdomäne der Momentanwert des Real
teils des analytischen Signals. Gemäß der folgenden Formel (2) wird in analoger
Weise ein Instant-Phasensignal berechnet:
IFI = arctan(Im/Re) (2)
wobei IFI einen Wert darstellt, der als momentane Phase des Signals angesehen
werden kann.
Aus der oben genannten EP 542 711 A ist ein Verfahren bekannt, mit dem Audio
signale bearbeitet werden können, um die Funktion von Hörgeräten zu verbes
sern. Dabei wird aus einem Eingangssignal ein analytisches Signal erzeugt, aus
dem ein Instant-Amplitudensignal berechnet wird. Dieses Instant-Amplitudensig
nal wird als Stellgröße verwendet, um das Eingangssignal oder eines der Hilbert-
Signale passend zu verstärken, so dass eine Signalkompression erreicht wird. Es
wird also das Instant-Amplitudensignal nur dazu verwendet, das Eingangssignal
entsprechend zu bearbeiten. Da jedoch die Verzögerung des Instant-Amplituden
signals und des damit gesteuerten Signals nicht übereinstimmen, kann eine voll
ständig befriedigende Lösung nicht erreicht werden.
Auch die US 4,495,443 A (ORBAN) und die US 6,205,225 B (ORBAN) zeigen
Verfahren, die durch eine Hilbert-Transformation zunächst ein analytisches Signal
erzeugen. In den obigen Schaltungen werden die Hilbert-Signale jedoch vor der
weiteren Verarbeitung gefiltert, so dass ein echtes Instant-Amplitudensignal
nicht erhalten werden kann. Mit solchen Verfahren können Signalspitzen be
grenzt werden, es ist jedoch nicht möglich, Störschall insgesamt wirksam zu un
terdrücken.
Aufgabe der vorliegenden Erfindung ist es, ein Verfahren der oben beschriebenen
Art anzugeben, bei dem Störschall wirksam unterdrückt werden kann. Insbeson
dere soll ein solches Verfahren eine leichte Einstellbarkeit und Anpassung an
verschiedenste Umgebungsbedingungen ermöglichen, wobei im Fall von Hörge
räten auch der spezifische Hörverlust der jeweiligen Person zu berücksichtigen
ist.
Erfindungsgemäß ist vorgesehen, dass die Schritte des Patentanspruches 1 aus
geführt werden. Wesentlich an der vorliegenden Erfindung ist, dass das Instant-
Amplitudensignal nicht wie beim Stand der Technik lediglich zur Steuerung oder
Bearbeitung des Eingangssignals verwendet wird, sondern dass das Amplituden
signal selbst modifiziert wird und mit einem Instant-Phasensignal zu einem Aus
gangssignal zusammengesetzt wird. Wesentlich ist weiters, dass die zusammen
gesetzten Signale die gleiche Verzögerung aufweisen, so dass Verzerrungen mi
nimiert werden können.
Die erfindungsgemäße Lösung bringt besondere Vorteile gegenüber dem Stand
der Technik, wenn das analytische Signal durch zwei Allpassfilter erzeugt wird.
Bei der bekannten Lösung entstehen in diesem Fall Phasenverzerrungen, die
nicht korrekte Ergebnisse bringen. Auch für die Systemintegration, bei der meh
rere Methoden in eine Schaltung bzw. einen Algorithmus integriert werden, ist
die erfindungsgemäße Synthese vorteilhaft.
Das Ausgangssignal Sout wird dabei nach folgender Formel (3) berechnet:
Sout = IAmod.cos(IFI) (3)
mit IAmod als modifiziertem Instant-Amplitudensignal und IFI als Instant-Phasen
signal.
Grundsätzlich kann mit dem obigen Verfahren sowohl eine Kompression als auch
eine Expansion erreicht werden. Bevorzugt ist es jedoch, wenn zumindest im
unteren Pegelbereich die nichtlineare Veränderung des Instant-Amplitudensignals
als Expansion ausgebildet ist, das heißt, dass kleine Pegel unterproportional ver
stärkt oder abgeschwächt werden. Auf diese Weise ist es möglich, leise Störun
gen in Sprechpausen wirksam zu unterdrücken. Der wesentliche Vorteil des er
findungsgemäßen Verfahrens besteht darin, dass ein sofortiges Ansprechverhal
ten erreicht wird, im Vergleich zu herkömmlichen Regelungen, die stets eine ge
wisse Einschwing- und Ausschwingzeit benötigen. Dies stellt einen wesentlichen
Vorteil der Erfindung dar.
Es ist klar, dass mit einer fix eingestellten Modifikation des Instant-Amplituden
signals eine optimale Anpassung nur an vorbestimmte Umgebungsbedingungen
möglich ist. Eine adaptive Regelung, die eine Anpassung an verschiedenartige
Umweltzustände ermöglicht, kann gemäß Anspruch 3 erreicht werden. Dies be
deutet, dass das Eingangssignal analysiert wird und aufgrund dieser Analyse die
Art der Modifikation des Instant-Amplitudensignals verändert wird. Die Bewer
tung wird dabei beispielsweise in der Weise erfolgen, dass zunächst herausge
funden wird, ob ein Sprachsignal vorliegt oder nicht und welcher Art ein mögli
ches Störsignal ist. In Abhängigkeit von dieser Analyse wird die Modifikation des
Instant-Amplitudensignals durchgeführt, wobei beispielsweise bei Abwesenheit
eines Sprachsignals generell eine Abschwächung durchgeführt wird, wogegen bei
Anwesenheit eines Sprachsignals nach Art der vorliegenden Störung eine ent
sprechende Bearbeitung vorgesehen wird.
Eine besonders schnelle und zuverlässige Bewertung kann gemäß Anspruch 4
erreicht werden. Die Grundidee dabei ist, dass die Sprache als Nutzsignal be
stimmte harmonische Strukturen aufweist, die zur Unterscheidung zwischen
Sprachsignalen und Störsignalen dienen können. dabei wurde festgestellt, dass
Sprachsignale eine relativ hohe Korrelation des erfindungsgemäß gebildeten In
stant-Amplitudensignals zum Instant-Frequenzsignal haben. Daraus kann eine
Bewertungsfunktion abgeleitet werden, die einen Bewertungsindex ausgibt, der
eine Aussage über das Vorliegen von Nutzsignalen (Sprache und Störsignalen)
ermöglicht. Im einfachsten Fall kann der Bewertungsindex lediglich zwei Werte
wie etwa 0 und 1 angeben, die für Störsignal beziehungsweise Sprachsignal ste
hen. In verfeinerten Ausführungen ist es möglich, mehrere Ausgabewerte den
Bewertungsindex vorzusehen oder einen kontinuierlichen Wertebereich bei
spielsweise zwischen 0 und 1 zu definieren, wobei der Wert des Bewertungsindex
die Wahrscheinlichkeit des Vorliegens von Sprachsignalen beziehungsweise Stör
signalen angibt oder bei vermischten Signalen ein Maß für den Anteil der jeweili
gen Signalkomponenten darstellt. Die zeitliche Ableitung des Phasensignals IFI
ist exakt ein Kreisfrequenzsignal IW, das nach Division durch 2π das eigentliche
Frequenzsignal IFR ergibt.
Eine besonders einfache Durchführung des Verfahrens ergibt sich gemäß An
spruch 5. Aufgrund der hohen Korrelation von IA und IW bei Sprachsignalen wird
sich das Verhältnis IA/IW bei solchen Signalen in einem relativ engen Bereich
bewegen. Ist das Verhältnis wesentlich kleiner oder wesentlich größer, so kann
daraus geschlossen, dass ein Störsignal dominiert. Der Bewertungsindex n kann
analytisch beispielsweise nach einer Formel n = exp(-(k - IA/IW)2) berechnet
werden, mit einem empirisch bestimmten Proportionalitätsfaktor k, wobei n = 1
exakte Proportionalität, also Sprachsignal, bedeutet und n << 1 kein Sprachsig
nal.
Durch die nichtlinearen Modifikationen des Instant-Amplitudensignals und des
Instant-Frequenzsignals kann eine schärfere Unterscheidung gewonnen werden.
Eine weitere Schärfung der Unterscheidung kann dadurch gewonnen werden,
dass die Schritte gemäß Anspruch 6 durchgeführt werden. Dies bedeutet, dass
nicht nur das Verhältnis von IA zu IW sondern auch das Verhältnis der zeitlichen
Ableitungen dieser Signale berücksichtigt wird, da bei Sprachsignalen auch die
Ableitungen miteinander korreliert sind. Der Bewertungsindex wird dann einen
großen Wert aufweisen, wenn sowohl die Korrelation der Signale selbst als auch
die Korrelation ihrer Ableitungen gegeben ist. Zu diesem Zweck werden die ent
sprechenden Teilbewertungsindizes additiv verknüpft. Es ist dabei möglich, die
eine oder die andere Teilbewertungsfunktion bei der Summenbildung stärker zu
gewichten, wobei die entsprechenden Gewichte gemäß den jeweilig herrschenden
Umständen durch Versuche leicht ermittelbar sind. Generell ist es vorteilhaft, die
differenzierten Signale stärker zu gewichten, indem beispielsweise der erste Teil
bewertungsindex mit w und der zweite Teilbewertungsindex mit (1 - w) multipli
ziert wird, wobei w beispielsweise zwischen 0,2 und 0,4 betragen kann.
Das Verfahren nach Anspruch 6 kann im Sinne einer bevorzugten Ausführung
weitergebildet werden, wie dies in den Ansprüchen 7 und 8 definiert ist.
Eine besonders bevorzugte Ausführungsvariante der Erfindung ist gemäß Patent
anspruch 10 gegeben. Es hat sich überraschenderweise herausgestellt, dass ein
Kennfeld, in dem die Wahrscheinlichkeitsdichte des Auftretens bestimmter Kom
binationen von Instant-Amplitudensignal und Instant-Frequenzsignal dargestellt
ist, für Sprache im Gegensatz zu sonstigen Signalen eine charakteristische Form
aufweist. Zunächst zerfällt das Kennfeld grundsätzlich in einen Bereich positiver
Werte der Instant-Frequenz und in einen Bereich negativer Instant-Frequenz. Für
die Beurteilung ist nur der erste Bereich relevant. Überrachenderweise hat sich
herausgestellt, dass bei Sprachsignalen in dem positiven Bereich zwei lokale Ma
xima vorliegen, von denen eines gleichzeitig das absolute Maximum ist. Die
Wahrscheinlichkeitsdichte weist somit eine zweihöckerige Struktur auf. Interes
santerweise ist diese Struktur weitgehend unabhängig von der gesprochenen
Sprache und der sprechenden Person. Aufgrund dieser Erkenntnis kann aus dem
Kennfeld auf das Vorliegen oder Nicht-Vorliegen von Sprache geschlossen wer
den.
Zur Erhöhung der Trennschärfe ist es vorteilhaft, wenn gemäß Anspruch 12 das
Eingangssignal amplitudenmäßig zunächst normalisiert wird. Dies erfolgt in be
kannter Weise mit einem AVC-Glied mit relativ langer Zeitkonstante, was be
wirkt, dass der Durchschnittspegel der Amplitude im Mittel im Wesentlichen kon
stant ist. Dieser Vorgang wird auch als langsame Kompression bezeichnet. In
sprachlicher Hinsicht werden dabei die Vokale eher unterdrückt, während die
Konsonanten verstärkt werden.
In kurzfristiger Hinsicht jedoch liegt eine Proportionalität zwischen der Instant-
Amplitude und der Instant-Frequenz vor, wie dies oben beschrieben ist. Der Pro
portionalitätsfaktor ist jedoch im Zeitablauf veränderlich.
Eine besonders günstige Ausbildung des erfindungsgemäßen Verfahrens ist in
Anspruch 14 gegeben. Auf diese Weise ist es insbesondere möglich, relativ stati
sche, schmalbandige Störungen wirksam zu unterdrücken. Im Prinzip könnte an
Stelle der Verzögerung von IA und IFI auch das Originalsignal direkt verzögert
werden. Dabei ergeben sich jedoch die oben beschriebenen Nachteile, insbeson
dere bei Verwendung von Allpassfiltern zur Erzeugung des analytischen Signals.
Außerdem sind Hilberttransformatoren sind nie perfekt, weil sie nicht kausal sind.
Bei einem theoretisch perfekten Transformator wäre die notwendige Verzögerung
unendlich lang, was in der Praxis unbrauchbar ist. Daher ist es angezeigt, die
Verzögerung im Bereich der komplexen Amplitude und Frequenz durchzuführen.
Dann sind die Fehler der Hilberttransformation für beide Signale gleich, und
kompensieren sich im Wesentlichen.
Dieses Verfahren ist besonders gut geeignet, ein relativ konstantes Störsignal
auszufiltern. Vorzugsweise erfolgt diese Filterung durch ein Verfahren nach An
spruch 15. dabei wird folgende Formel (4) verwendet:
Sout = Sdel - n.Sint (4)
Der Faktor n liegt gemäß Anspruch 16 zwischen 0 und 1 und bestimmt das Aus
maß, in dem die statische Komponente abgeschwächt wird, um als Ausgangssig
nal die dynamische Komponente zu erhalten. Es hat sich gezeigt, dass auf diese
Weise auch Störungen wirksam ausgefiltert werden können, die wesentlich grö
ßer sind als das Nutzsignal selbst. Dazu ist erforderlich, den Faktor n relativ groß
zu wählen, das heißt, dass dieser Faktor nahe bei 1 liegt. In dem Fall, dass je
doch eine sehr geringe Störung vorliegt, wird auf diese Weise das Nutzsignal
selbst in unerwünschter Weise verzerrt. Durch die in Anspruch 16 angegebene
Maßnahme kann auf einfache Weise dieses Problem behoben werden, da sich
herausgestellt hat, dass das Verhältnis der Signalstärke des integrierten Aus
gangssignals zum verzögerten Ausgangsignal ein sehr gutes Maß dafür ist, wie
groß eine unerwünschte statische Komponente ist.
Eine zusätzliche Verbesserung kann gemäß Anspruch 17 erreicht werden. Je nach
Anzahl der Frequenzbänder können dabei verschiedenartige statische Signale
selektiert ausgefiltert werden.
Weiters betrifft die Erfindung eine Vorrichtung zur Signalbearbeitung zur Durch
führung eines der oben beschriebenen Verfahren.
In der Folge wird die vorliegende Erfindung anhand der in den Figuren darge
stellten Ausführungsbeispiele näher erläutert.
Es zeigen
Fig. 1 und 2 Blockdiagramme von Schaltungen, die bei der vorliegenden Erfin
dung verwendet werden,
Fig. 3 ein Blockdiagramm einer einfachen Vorrichtung zur Unterdrückung von
Störschall,
Fig. 4a, 4b, 4c Diagramme, die die Expansion von Signalen erläutern,
Fig. 5, 6 und 7 Blockdiagramme von weiteren Vorrichtungen zur Unterdrückung
von Störschall,
Fig. 8 verschiedene Diagramme, die die Wirksamkeit der Unterdrückung von
Störschall zeigen,
Fig. 9 und 10 weitere Blockdiagramme von Vorrichtungen zur Unterdrückung von
Störschall,
Fig. 11 und 12 Blockdiagramme von Schaltungen zum Erkennen von Sprachsig
nalen,
Fig. 13 und 14 Diagramme, die die Wirkung von Schaltungen zur Erkennung von
Sprachsignalen erläutern,
Fig. 15 ein dreidimensionales Diagramm in axonometrischer Darstellung, das ein
Kennfeld der Wahrscheinlichkeitsdichte von Instant-Ampitude und Instant-Fre
quenz für Sprache darstellt,
Fig. 16 das Kennfeld von Fig. 15 in einer Schichtliniendarstellung,
Fig. 17 ein Diagramm analog zu Fig. 15 für Störsignale, und
Fig. 18 das Diagramm von dem Kennfeld in Fig. 17 in einer Schichtliniendarstel
lung.
In Fig. 1 ist eine allgemeine Schaltung gezeigt, in der aus einem Eingangssignal
ein Instant-Amplitudensignal IA, ein Instant-Phasensignal IFI und ein Instant-
Kreisfrequenzsignal IW gewonnen wird. In einem ersten Block 1 wird das Ein
gangssignal Sin in ein analytisches Signal umgewandelt, das aus einem Realteil
Re und einem Imaginärteil Im besteht. Da der Realteil und der Imaginärteil einen
konstanten Phasenunterschied von π/2 aufweisen, stellt der Imaginärteil Im die
Hilbert-Transformierte des Realteils Re dar. Diese Signale Re und Im werden
somit auch als Hilbert-Signale beizeichnet. Möglichkeiten zur Gewinnung des
analytischen Signals sind in der EP 542 710 A beschrieben. Im Wesentlichen
kann man das Eingangssignal Sin einer Hilbert-Transformation unterziehen, um
beispielsweise zum Imaginärteil Im zu kommen. Da die Hilbert-Transformation
mit einer Verzögerung verbunden ist, muss das Eingangssignal Sin ebenfalls ver
zögert werden, um den Realteil Re zu erhalten. Eine alternative Möglichkeit be
steht darin, das Eingangssignal Sin durch zwei unterschiedliche Allpassfilter in
zwei Hilbert-Signale umzuwandeln. Eine weitere Möglichkeit zum Erhalten des
analytischen Signals besteht darin, durch eine Fourier-Transformation ein kom
plexes Spektrum des Eingangssignals Sin zu erhalten, alle Linien um π/2 zu ver
schieben und das Signal durch inverse Transformation wieder in die Zeitdomäne
zurückzusetzen. Durch die Möglichkeiten der digitalen Signalbearbeitung ist es
unproblematisch, ein solches analytisches Signal in geeigneter Weise zu erhalten.
In den Blöcken 2 und 3 wird gemäß den obigen Formeln (1) und (2) das Instant-
Amplitudensignal IA beziehungsweise das Instant-Phasensignal IFI erhalten.
Durch zeitliche Ableitung des Instant-Phasensignals IFI in Block 4 kann das In
stant-Kreisfrequenzsignal IW gebildet werden. Es muss festgehalten werden,
dass die Signale IA, IFI und IW abgesehen von der Verzögerung durch die Hil
bert-Transformation Echtzeitparameter sind, die frei von Mittelungen oder Verzö
gerungen sind. Die Instant-Amplitude IA ist stets nichtnegativ, wogegen das In
stant-Kreisfrequenzsignal IW nicht notwendigerweise positiv ist. Da das Instant-
Phasensignal im Wesentlichen einen Winkel definiert, kann es durch das soge
nannte Wraping auf einen Bereich zwischen 0 und 2π oder auf einem Bereich
zwischen -π und π eingeschränkt werden.
In Fig. 2 sind die einzelnen Bearbeitungsschritte von Fig. 1 in einem einzigen
Block 5 zusammengefasst, um die Darstellung in weiterer Folge zu vereinfachen.
Störungen geringer Amplitude können in allgemeiner Form durch eine Schaltung
gemäß Fig. 3 unterdrückt werden. Dabei wird das Instant-Amplitudensignal IA
aus dem Block 5 in einer Look up Table einer nichtlinearen Veränderung unterzo
gen, wodurch ein modifiziertes Instant-Amplitudensignal IAmod erzeugt wird. An
Stelle einer Look up Table kann auch eine geschlossen angegebene Funktion
oder dgl. zur Erzeugung von IAmod verwendet werden. In einer Verknüpfungs
schaltung 7 wird das Ausgangssignal Sout aus dem modifizierten Instant-Amplitu
densignal IAmod und dem Instant-Phasensignal IFI aus der oben beschriebenen
Formel (3) berechnet.
In Fig. 4a, 4b und 4c sind drei verschiedene Varianten dargestellt, wie das In
stant-Amplitudensignal IA durch nichtlineare Transformation zu dem modifizier
ten Instant-Amplitudensignal IAmod umgewandelt werden kann.
In allen drei Diagrammen ist oberhalb eines vorbestimmten Grenzwerts IAlim des
Instant-Amplitudensignals IA eine direkte Proportionalität zwischen IAmod und IA
gegeben. Unterhalb dieses Grenzwerts IAlim ist IAmod kleiner als es der Proportio
nalität entspricht. Bei der Ausführungsvariante von Fig. 4a ist eine Beziehung
zwischen IAmod und IA durch gerade Kurvenabschnitte 101, 102, 103 gegeben,
wobei der Kurvenabschnitt 101 die geringste Abschwächung bedeutet, wogegen
der Kurvenabschnitt 103 bedeutet, dass IAmod für Werte unterhalb von IAlim auf
Null gesetzt ist. Bei der Ausführungsvariante von Fig. 4b gibt es einen Über
gangsbereich unmittelbar unterhalb von IAlim und daran anschließend Kurvenab
schnitte 104, 105, 106, die parallel zum proportionalen Bereich 100 sind. Bei der
Ausführungsvariante von Fig. 4c setzt sich der proportionale Bereich 100 unter
halb von IAlim in Kurven 107, 108 fort, die eine größere Steigung aufweisen. Die
Darstellungen in Fig. 4a, 4b, 4c sind schematisch, und es können die dargestell
ten Kurven auch auf eine logarithmische Darstellung von IAmod oder IA angewen
det werden, um zu einer üblichen dB-Skala zu gelangen.
Fig. 5 zeigt eine erweiterte Ausführungsvariante ausgehend von der Lösung von
Fig. 3, wobei die nichtlineare Bearbeitung des Instant-Amplitudensignals IA in
Abhängigkeit von einer Bewertung des Eingangssignals Sin in Block 8 verändert
wird. Das Ergebnis des Bewertungsblocks 8 wird als Steuersignal der Look up
Table 9 zugeführt. das Ausgangssignal Sout wird wie zuvor in dem Block 7 aus
IAmod und IFI gebildet.
Fig. 6 zeigt eine dreikanalige Lösung, bei der das Eingangssignal Sin durch ein
Hochpassfilter 10, ein Bandpassfilter 11 und ein Tiefpassfilter 12 in drei verschie
dene Frequenzbänder unterteilt wird, die in getrennten Kanälen weiter bearbeitet
werden. Alternativ können auch drei oder mehr Bandpassfilter verwendet wer
den, um beliebig viele Kanäle darzustellen.. Mit 13, 14, 15 sind jedem Kanal
Signalbearbeitungsschaltungen zugeordnet, die der Ausführungsvariante von
Fig. 3 oder von Fig. 5 entsprechen. Verstärker 16, 17, 18 verstärken die Signale
jedes Kanals, und in einem Addierglied 19 werden die Signale der einzelnen Ka
näle zu einem Ausgangssignal Sout aufaddiert. Die Verbesserung der Schaltung
von Fig. 6 gegenüber den zuvor beschriebenen Schaltungen besteht darin, dass
anstelle einer breitbandigen und frequenzunabhängigen Regelung eine selektive
Regelung in einzelnen Frequenzbereichen erfolgt. Auf diese Weise kann das so
genannte Atmen der Regelung unterdrückt werden, das im praktischen Betrieb
bisweilen störbar ist. Außerdem ergibt sich bei Hörgeräten eine verbesserte An
passungsmöglichkeit an den spezifischen Hörverlust.
Die Schaltung von Fig. 7 ist besonders dazu ausgelegt, schmalbandige Störungen
zu unterdrücken. In den Blöcken 20 und 21 wird zunächst das Instant-Amplitu
densignal IA bzw. das Instant-Phasensignal IFI in der Frequenzdomäne einer
zeitlichen Mittelung unterzogen und anschließend integriert. Dies kann bei
digitaler Signalbearbeitung in einfacher Weise dadurch erfolgen, dass die Signale
IA und IFI im aktuellen Zeitpunkt t und zu den k unmittelbar zurückliegenden
Zeitpunkten t - 1, t - 2 . . . t - k gemittelt werden, um das integrierte Instant-
Amplitudensignal IAint und das integrierte Instant-Phasensignal IFIint zu erhalten.
In dem Block 7a werden diese Signale gemäß der folgenden Formel (3a) zu
einem integrierten Ausgangssignal Sint zusammengesetzt.
Sint = IAint.cos(IFIint) (3a)
Parallel dazu werden das Instant-Amplitudensignal IA bzw. das Instant-Phasen
signal IFI in den Blöcken 22 und 23 um eine Zeitdauer verzögert, die der Verzö
gerung entspricht, die durch die Mittelwertbildung in den Blöcken 20 und 21 ver
ursacht ist. Bei der oben beschriebenen Mittelung beträgt die Verzögerung k/2.
Auf diese Weise werden das verzögerte Instant-Amplitudensignal IAdel bzw. das
verzögerte Instant-Phasensignal IFIdel gebildet.
In dem Block 7b werden diese Signale gemäß der folgenden Formel (3b) zu ei
nem verzögerten Ausgangssignal Sdel zusammengesetzt.
Sdel = IAdel.cos(IFIdel) (3b)
In einem Subtraktionsglied 24 wird von dem verzögerten Ausgangssignal Sdel das
integrierte Ausgangssignal Sint ganz oder teilweise subtrahiert, um das Aus
gangssignal Sout zu erhalten, das auf diese Weise die dynamische Komponente
des Eingangssignals Sin darstellt.
Durch die Schaltung von Fig. 7 ist es mit sehr gutem Erfolg möglich relativ kon
stante, schmalbandige Störungen auszufiltern, d. h. Störsignale, deren Frequenz
und Amplitude sich nur langsam ändert. Dabei ist es durchaus möglich, dass das
Störsignal wesentlich größer als das Nutzsignal ist.
Es hat sich herausgestellt, dass die Länge k des Zeitfensters, über dem die
Mittelwertbildung erfolgt, kritisch für die Qualität der Signalbearbeitung ist. Da
her hat eine digitale Signalbearbeitung nach dem oben beschriebenen Algorith
mus wesentliche Vorteile gegenüber einer analogen Schaltung mit Filtern, da der
Wert von k leicht an die jeweiligen Verhältnisse angepasst werden kann.
In Fig. 8 ist die Wirksamkeit der Schaltung nach Fig. 7 aufgezeigt. Die Dia
gramme von Fig. 8 zeigen Signale jeweils für einen Zeitabschnitt von 1,5 Sekun
den. Im oberen Diagramm ist ein Eingangssignal Sin gezeigt, das sich aus einem
Nutzsignal, nämlich Musik, mit einer Amplitude von etwa 0,1 und einem Störsig
nal, einem gewobbelten Ton mit einer Amplitude von 5 zusammensetzt. Die
Störung ist also um etwa 34 dB größer als das Nutzsignal. Im mittleren Dia
gramm ist das integrierte Ausgangssignal Sint gezeigt, das die isolierte Störung
repräsentiert. Im unteren Diagramm ist das Ausgangssignal Sout aufgetragen, das
aus der Differenz des verzögerten Ausgangssignals Sdel und des integrierten Aus
gangssignals Sint gebildet ist.
In Fig. 9 ist eine dreikanalige Schaltung dargestellt, die gegenüber der von Fig. 7
zwei wesentliche Vorteile besitzt. Zum einen wird das Eingangssignal Sin wie in
Fig. 6 durch ein Hochpassfilter 10, ein Bandpassfilter 11 und ein Tiefpassfilter 12
in drei verschiedene Frequenzbänder unterteilt, die in getrennten Kanälen weiter
bearbeitet werden. Mit 25, 26, 27 sind in der Fig. 9 Blöcke bezeichnet, die jeweils
einer Schaltung von Fig. 7 mit Ausnahme des Subtraktionsglieds 24 entsprechen.
An den Ausgängen dieser Blöcke 25, 26, 27 liegt jeweils das verzögerte Aus
gangssignal Sdel und das integrierte Ausgangssignal Sint für jeden Frequenzbe
reich an. Auf diese Weise ist es möglich, bis zu drei voneinander unabhängige
quasistatische Störungen optimal auszufiltern. Es ist offensichtlich, dass die An
zahl der Kanäle je nach Bedarf und der verfügbaren Rechenleistung beliebig ge
wählt werden kann.
Ein weiterer Unterschied der Ausführungsvariante von Fig. 9 zu der oben be
schriebenen Lösung besteht darin, dass in Bewertungsgliedern 28, 29, 30 die
Signale Sdel und Sint für jeden Frequenzbereich analysiert werden. Es hat sich
nämlich herausgestellt, dass die Schaltung von Fig. 7 sehr gute Ergebnisse
bringt, wenn tatsächlich eine beträchtliche Störung vorliegt. Bei ungestörten Ein
gangssignalen jedoch wird ebenfalls ein statischer Anteil ausgefiltert, was zu un
erwünschten Verzerrungen führt. In den Bewertungsgliedern 28, 29, 30 wird ver
sucht, das Ausmaß der Störung zu erfassen, um eine überschießende Korrektur
zu vermeiden. Im einfachsten Fall wird im Wesentlichen das Verhältnis aus dem
verzögerten Ausgangssignal Sdel und dem integrierten Ausgangssignal Sint für je
den Frequenzbereich ermittelt. Dies kann beispielsweise nach folgender Formel
(6) erfolgen:
n = f(MASint/(MASdel - MASint)) (6)
Dabei stellt MASint als gemittelter Absolutwert von Sint die statische Komponente
und (MASdel - MASint) die dynamische Komponente in dem jeweiligen Kanal dar,
wobei MASdel den gemittelten Absolutwert von Sdel bezeichnet. Mit der Bewer
tungsfunktion f, die durch eine Look up Table realisiert ist, wird ein Bewertungs
index n berechnet, der zwischen 0 und 1 liegt. Je größer die statische Kompo
nente MASint im Vergleich zu der dynamischen Komponente (MASdel - MASint) ist,
um so näher liegt n bei 1. Umgekehrt wird n für Werte des Verhältnisses
(MASint/(MASdel - MASint) unterhalb eines vorbestimmten Grenzwerts mit Null
festgelegt. Die Bewertungsfunktion f kann auf empirischem Weg optimiert wer
den.
Mit dem so bestimmten Bewertungsindex n, der für den ersten Kanal mit na be
zeichnet ist, kann in den Subtraktionsgliedern 31, 32, 33 für jeden Kanal ein
Ausgangssignal berechnet werden. Am Beispiel des ersten Kanals lautet die For
mel:
Sout1 = Sdel - na.Sint (7)
Aus dieser Formel (7) ist ersichtlich, dass die Korrektur um so größer ist, je
größer die statische Komponente ist. Auf diese Weise können Verzerrungen mi
nimiert und die Entstehung von Artefakten vermieden werden.
Analog zu der Schaltung von Fig. 6 werden in einem Addierglied 19 die Signale
der einzelnen Kanäle zu einem Ausgangssignal Sout aufaddiert.
In Fig. 10 ist eine Schaltung dargestellt, die weitgehend der von Fig. 9 ent
spricht. Es werden daher nur die Unterschiede erklärt. Es werden bei dieser Aus
führung die verzögerten Ausgangssignale Sdel und die integrierten Ausgangssig
nale Sint aller Kanäle in den Addiergliedern 19a und 19b addiert. Auf diese Weise
erhält man ein verzögertes Ausgangssignal Sdel und ein integriertes Ausgangssig
nal Sint für alle Kanäle. In dem Bewertungsglied 28 wird wie oben beschrieben die
Berechnung nach Formel (6) ausgeführt, und in dem Subtraktionsglied 31 erfolgt
die Bestimmung des Ausgangssignal Sout nach Formel (7).
Eine solche Schaltung besitzt einen einfacheren Aufbau und benötigt weniger Re
chenleistung als die von Fig. 9, wobei jedoch die Unterscheidung zwischen Nutz
signal und Störung nicht so genau ist.
In den Bewertungsgliedern 28, 29, 30 kann alternativ oder zusätzlich ein Ver
fahren zur Erkennung von Sprache ausgeführt werden, wie dies in der Folge be
schrieben ist.
In Fig. 11 ist in allgemeiner Form eine Schaltung zur Erkennung von Störsigna
len. In dem Block 40 wird eine Normierung der Amplitude durchgeführt, wobei
die Zeitkonstanten relativ lang sein sollten. Durch die Normierung wird der Um
stand ausgeglichen, dass der Pegel der Eingangssignale je nach Entfernung zum
Sprecher sehr unterschiedlich sein kann, was die Korrelation, die in der Folge
beschrieben wird, stört. Durch die relativ lange Zeitkonstante bleibt jedoch die
Dynamik der Sprache erhalten, und Störungen in kürzeren Sprechpausen werden
nicht überbetont.
Der Block 5 liefert ein Instant-Amplitudensignal IA, ein Instant-Phasensignal IFI
und ein Instant-Kreisfrequenzsignal IW, wie dies zu Fig. 1 und 2 beschrieben
worden ist. In Block 41 wird aus dem Instant-Kreisfrequenzsignal IW durch
Division durch 2π das Instant-Frequenzsignal IFR berechnet. Daraus und dem
Instant-Amplitudensignal IA wird ein Bewertungsindex aus einer Bewertungsbe
wertungsfunktion errechnet. Die Erkennung von Sprache als Nutzsignal, aber
auch in geringerem Umfang von Musik beruht auf der Tatsache, dass bei Vorlie
gen harmonischer Komponenten eine Korrelation zwischen und dem Instant-
Amplitudensignal IA und dem Instant-Frequenzsignal IFR zu beobachten ist.
Überraschenderweise liegt jedoch eine solche Korrelation in geringerem Umfang
auch bisweilen bei nicht harmonischen Signalen vor, keinesfalls jedoch bei Rau
schen.
Im einfachsten Fall wird das Verhältnis des Instant-Amplitudensignals IA und
dem Instant-Frequenzsignal IFR als Variable für die Bewertungsfunktion heran
gezogen. Es kann aber auch vor der Bildung des Verhältnisses eine nichtlineare
Transformation durchgeführt werden, um ein modifizertes Instant-Amplituden
signal IAmod bzw. ein modifizertes Instant-Frequenzsignal IFRmod zu erhalten:
IAmod = f(IA) (8)
IFRmod = g(IFR) (9)
Die Bewertungsfunktionen f und g sind nichtlineare, vorzugsweise monotone
Funktionen, wie In(x) oder x3, werden jedoch im Allgemeinen durch Look up
Tables realsiert, die empirisch ermittelt werden. Dazu werden Signale, die Stö
rungen unterschiedlichen Typs und die unterschiedliche Sprachanteile aufweisen,
hergestellt und gemäß Fig. 11 analysiert. Durch Variation von f und g kann die
Korrelation des Bewertungsindex n mit dem tatsächlichen Sprachanteil optimiert
werden. Inputgröße der Bewertungsfunktion ist in diesem Fall IAmod/IFRmod.
Eine verbesserte Erkennung ermöglicht die Schaltung gemäß Fig. 12, bei der
nicht nur die Korrelation zwischen dem Instant-Amplitudensignal IA und dem In
stant-Frequenzsignal IFR oder einer dazu ähnlichen Größe in Betracht gezogen
wird, um einen ersten Teilbewertungsindex n1 zu erhalten, sondern auch die
Korrelation zwischen den zeitlichen Ableitungen IAdiff bzw. IFRdiff. dieser Größen,
die in den Differenziergliedern 4a, 4b gebildet werden.
In den Blöcken 43 und 44 wird wie oben beschrieben eine nichtlineare Transfor
mation durchgeführt werden, um ein modifizertes Instant-Amplitudensignal IAmod
bzw. ein modifizertes Instant-Frequenzsignal IFRmod zu erhalten. Nicht darge
stellt, jedoch möglich, ist eine nichtlineare Transformation der zeitlichen Ablei
tungen IAdiff bzw. IFRdiff. zu modifizierten Ableitungen IAdiffmod bzw. IFRdiffmod.
Ein erster Teilbewertungsindex wird erhalten, indem in dem Block 41a, der im
Wesentlichen ein Multiplikator ist, das modifizerte Instant-Amplitudensignal IAmod
bzw. das modifizerte Instant-Frequenzsignal IFRmod miteinander multipliziert wer
den. Wenn die nichtlinearen Transformationen in den Blöcken 43 und 44 so
durchgeführt werden, dass IAmod und IFRmod um den Nullpunkt schwanken, dann
ist das Produkt bei hoher Korrelation groß, ansonsten klein.
In dem Block 41b wird in analoger Weise eine zweite Teilbewertungsfunktion aus
den Ableitungen berechnet, um einen zweiten Teilbewertungsindex n2 zu erhal
ten.
Block 41 arbeitet wie oben beschrieben. In den Blöcken 45 und 46 wird eine
zeitliche Mittelwertbildung durchgeführt, um geringfügige Phasenunterschiede
zwischen den Signalen, die die Korrelation beeinträchtigen, auszugleichen. Da
durch wird im Wesentlichen eine Kreuzkorrelationsberechnung durchgeführt.
In einem Addierglied 47 werden die Ausgänge der Blöcke 45 und 46 addiert, wo
bei gegebenenfalls eine Gewichtung durchgeführt werden kann, um den endgül
tigen Bewertungsindex n zu erhalten. Vorteilhaft ist an dieser Ausführungsvari
ante, dass die Blöcke 41, 43 und 44 einerseits und 42 andererseits getrennt von
einander optimiert werden können, was die Bestimmung der Funktionen und Ko
effizienten erleichtert.
In Fig. 13 ist für ein Signal, das primär aus Sprache besteht, IA und IFR aufge
tragen. Das Instant-Amplitudensignal IA ist stark verstärkt im oberen Bereich als
helle Kurve dargestellt. Darunter ist das Instant-Frequenzsignal IFR dunkle Kurve
aufgetragen. Die Korrelation zwischen diesen Signalen ist offensichtlich.
In Fig. 14 ist ein Sprachsignal, das im mittleren Abschnitt dargestellt ist, durch
eine starke Störung überlagert, wobei das Summensignal unten hell dargestellt
ist. Im oberen Bereich ist der Bewertungsindex n aufgetragen, der gemäß der
Schaltung von Fig. 11 ermittelt worden ist.
Es ist umittelbar ersichtlich, dass ein Wert n < 3 nahezu sicher auf die Anwesen
heit von Sprache schließen lässt, wogegen n < 3 die Abwesenheit eines Sprach
signals anzeigt. Auf diese Weise ist es möglich, die Verstärkung und die Signal
bearbeitung zu optimieren. Im einfachsten Fall wird bei Abwesenheit eines
Sprachsignals die Verstärkung um ein vorbestimmtes Ausmaß verringert.
In Fig. 15 ist in einer dreidimensionalen Darstellung die Wahrscheinlichkeits
dichte von Instant-Ampitude und Instant-Kreisfrequenz für ein Sprachsignal dar
gestellt. Die Instant-Kreisfrequenz nimmt sowohl positive als auch negative
Werte an, wobei in der Darstellung der Bereich zwischen -200π und 200π ausge
nommen ist, da dieser Bereich für die Analyse unbedeutend ist, jedoch Signale in
diesem Frequenzbereich eine hohe Energie haben können, insbesondere bei
Plosiven, was die Berechnungen unter Umständen stört.
Es ist aus Fig. 15 eine für Sprache typischen zweihügelige Struktur ersichtlich,
das heißt, dass in dem Kennfeld zwei lokale Maxima 50 und 51 vorliegen. Dies ist
auch aus der Schichtliniendarstellung von Fig. 16 ersichtlich.
Fig. 17 und 18 entsprechen Fig. 15 und 16, jedoch für ein Störsignal ohne
Sprachanteil. Im positiven Bereich der Instant-Kreisfrequenz liegt dabei nur ein
Hügel vor.
Claims (18)
1. Verfahren zur Unterdrückung von Störschall mit folgenden Schritten:
- - Gewinnen eines analytischen Signals aus einem Eingangssignal (Sin);
- - Berechnen eines Instant-Amplitudensignals (IA) aus dem analytischen Signal;
- - Berechnen eines Instant-Phasensignals (IFI) aus dem analytischen Sig nal;
- - nichtlineares Verändern des Instant-Amplitudensignals (IA) zu einem modifizierten Instant-Amplitudensignal (IAmod);
- - Verknüpfen des modifizierten Instant-Amplitudensignals (IAmod) mit dem Instant-Phasensignal (IFI) zu einem Ausgangssignal (Sout).
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die nichtline
are Veränderung des Instant-Amplitudensignals (IA) eine Expansion ist.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die nichtline
are Veränderung des Instant-Amplitudensignals (IA) aufgrund einer Bewer
tung des Eingangssignals (Sin) durchgeführt wird.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die Bewer
tung aufgrund einer Bewertungsfunktion durchgeführt wird, die aus dem In
stant-Amplitudensignal (IA) und einem durch zeitliche Ableitung des In
stant-Phasensignals (IFI) gewonnenen Instant-Frequenzsignal (IFR) be
rechnet wird, um einen Bewertungsindex (n) zu erhalten.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass das Berech
nen der Bewertungsfunktion durch folgende Schritte erfolgt:
- - nichtlineares Verändern des Instant-Amplitudensignals (IA) zu einem modifizierten Instant-Amplitudensignal (IAmod);
- - nichtlineares Verändern des Instant-Frequenzsignals (IFR) zu einem modifizierten Instant-Frequenzsignal (IFRmod);
- - Berechnen der Bewertungsfunktion aus dem Verhältnis des modifizierten Instant-Amplitudensignals (IAmod) zum modifizierten Instant-Frequenzsig nal (IFRmod), um den Bewertungsindex (n) zu erhalten.
6. Verfahren nach einem der Ansprüche 3 bis 5, dadurch gekennzeichnet,
dass aus dem Instant-Amplitudensignal (IA) und dem Instant-Frequenzsig
nal (IFR) ein erster Teilbewertungsindex (n1) gebildet wird, dass aus einer
zeitlichen Ableitung des Instant-Amplitudensignals (IA) und einer zeitlichen
Ableitung des Instant-Frequenzsignals (IFR) ein zweiter Teilbewertungsin
dex (n2) gebildet wird und dass der erste und der zweite Teilbewertungsin
dex (n1 n2) im Wesentlichen additiv verknüpft werden, um den Bewer
tungsindex (n) zu berechnen.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass das Berech
nen der ersten Teilbewertungsfunktion durch folgende Schritte erfolgt:
- - nichtlineares Verändern des Instant-Amplitudensignals (IA) zu einem modifizierten Instant-Amplitudensignal (IAmod);
- - nichtlineares Verändern des Instant-Frequenzsignals (IFR) zu einem modifizierten Instant-Frequenzsignal (IFRmod);
- - Berechnen der ersten Teilbewertungsfunktion aus dem Verhältnis des modifizierten Instant-Amplitudensignals (IAmod) zum modifizierten In stant-Frequenzsignal (IFRmod), um einen ersten Teilbewertungsindex (n1) zu erhalten.
8. Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, dass das
Berechnen der zweiten Teilbewertungsfunktion durch folgende Schritte er
folgt:
- - nichtlineares Verändern einer zeitlichen Ableitung des Instant- Amplitudensignals (IA) zu einem modifizierten differenzierten Instant- Amplitudensignal (IAdiffmod);
- - nichtlineares Verändern einer zeitlichen Ableitung des Instant- Frequenzsignals (IFR) zu einem modifizierten differenzierten Instant-Fre quenzsignal (IFIdiffmod);
- - Berechnen der zweiten Teilbewertungsfunktion aus dem Verhältnis des modifizierten differenzierten Instant-Amplitudensignals (IAdiffmod) zum modifizierten differenzierten Instant-Frequenzsignal (IFIdiffmod), um einen zweiten Teilbewertungsindex (n2) zu erhalten.
9. Verfahren nach einem der Ansprüche 6 bis 8, dadurch gekennzeichnet,
dass der zweite Teilbewertungsindex (n2) bei additiven Verknüpfung stärker
gewichtet wird als der erste Teilbewertungsindex (n1).
10. Verfahren nach Anspruch 3 oder 4, dadurch gekennzeichnet, dass vorab
ein zweidimensionales Kennfeld erstellt wird, in dem für ein Nutzsignal, vor
zugsweise Sprache, die Wahrscheinlichkeitsdichte als Funktion des Instant-
Amplitudensignals (IA) und des Instant-Frequenzsignals (IFI) angegeben
ist, und dass die Bewertungsfunktion auf der Basis dieses Kennfelds be
stimmt wird.
11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass in dem
Kennfeld zwei nicht zusammenhängende Bereiche definiert werden, die dem
Nutzsignal zugeordnet werden, und dass der übrige Bereich des Kennfelds
dem Störsignal zugeordnet wird.
12. Verfahren nach einem der Ansprüche 3 bis 11, dadurch gekennzeichnet,
dass das Eingangssignal (Sin) vorab einer Normalisierung der Amplitude
unterzogen wird.
13. Verfahren zur Unterdrückung von Störschall, bei dem ein Eingangssignal
(Sin) in mehrere Frequenzbänder unterteilt wird, das Signal jedes Frequenz
bandes einem Verfahren nach einem der Ansprüche 1 bis 12 unterworden
wird, und bei dem die Ausgangssignale (Sout1, Sout2, Sout3) der einzelnen Fre
quenzbänder zu einem Gesamt-Ausgangssignal (Sout) addiert werden.
14. Verfahren zur Unterdrückung von Störschall mit folgenden Schritten:
- - Gewinnen eines analytischen Signals aus einem Eingangssignal (Sin);
- - Berechnen eines Instant-Amplitudensignals (IA) aus dem analytischen Signal;
- - Berechnen eines Instant-Phasensignals (IFI) aus dem analytischen Sig nal;
- - Bilden eines integrierten Instant-Amplitudensignals (IAint) als zeitlicher Mittelwert des Instant-Amplitudensignals (IA);
- - Bilden eines integrierten Instant-Phasensignals (IFIint), wobei eine zeitliche Ableitung des Instant-Phasensignals (IFI) gebildet und das Ergebnis zeitlich gemittelt und integriert wird;
- - Bilden eines verzögerten Instant-Amplitudensignals (IAdel) durch Verzö gern des Instant-Amplitudensignals (IA) um eine Verzögerungszeit, die der Verzögerung durch die Mittelwertbildung des Instant-Amplituden signals (IA) entspricht;
- - Bilden eines verzögerten Instant-Phasensignals (IFIdel) durch Verzögern des Instant-Phasensignals (IFI) um eine Verzögerungszeit, die der Verzö gerung durch die Mittelwertbildung des Instant-Phasensignals (IFI) ent spricht;
- - Verknüpfen des integrierten Instant-Amplitudensignals (IAint) mit dem in tegrierten Instant-Phasensignal (IFIint) zu einem integrierten Ausgangs signal (Sint);
- - Verknüpfen des verzögerten Instant-Amplitudensignals (IAdel) mit dem verzögerten Instant-Phasensignal (IFIdel) zu einem verzögerten Aus gangssignal (Sdel);
- - Verknüpfen des integrierten Ausgangssignals (Sint) mit dem verzögerten Ausgangssignal (Sdel).
15. Verfahren nach Anspruch 14, dadurch gekennzeichnet, dass das
Verknüpfen des integrierten Ausgangssignals mit dem verzögerten Aus
gangssignal durch Subtraktion des mit einem Faktor multiplizierten integ
rierten Ausgangssignals von dem verzögerten Ausgangssignal erfolgt.
16. Verfahren nach einem der Ansprüche 14 oder 15 dadurch gekennzeich
net, dass der Faktor zwischen 0 und 1 liegt und aus dem Verhältnis der
Signalstärke des integrierten Ausgangssignals (Sint) zum verzögerten Aus
gangssignal (Sdel) bestimmt wird.
17. Verfahren zur Unterdrückung von Störschall, bei dem ein Eingangssignal in
mehrere Frequenzbänder unterteilt wird, das Signal jedes Frequenzbandes
einem Verfahren nach einem der Ansprüche 14 bis 16 unterworden wird,
und bei dem die Ausgangssignale der einzelnen Frequenzbänder zu einem
Gesamt-Ausgangssignal (Sout) addiert werden.
18. Vorrichtung zur Signalbearbeitung zur Durchführung eines Verfahrens nach
einem der Ansprüche 1 bis 17, mit einer Schaltung zur Gewinnung eines In
stant-Amplitudensignals (IA) und eines Instant-Phasensignal (IFI) aus ei
nem Eingangssignal (Sin), dadurch gekennzeichnet, dass in einem Ver
knüpfungsglied ein durch nichtlineares Verändern gewonnenes modifiziertes
Instant-Amplitudensignal (IAmod) mit dem Instant-Phasensignal (IFI) zu ei
nem Ausgangssignal (Sout) verknüpft wird.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE2001137395 DE10137395C1 (de) | 2001-07-31 | 2001-07-31 | Verfahren zur Unterdrückung von Störschall |
US10/210,641 US7092877B2 (en) | 2001-07-31 | 2002-07-31 | Method for suppressing noise as well as a method for recognizing voice signals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE2001137395 DE10137395C1 (de) | 2001-07-31 | 2001-07-31 | Verfahren zur Unterdrückung von Störschall |
Publications (1)
Publication Number | Publication Date |
---|---|
DE10137395C1 true DE10137395C1 (de) | 2003-02-13 |
Family
ID=7693794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2001137395 Expired - Fee Related DE10137395C1 (de) | 2001-07-31 | 2001-07-31 | Verfahren zur Unterdrückung von Störschall |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE10137395C1 (de) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0542710A1 (de) * | 1991-11-13 | 1993-05-19 | Viennatone Aktiengesellschaft | Verfahren zur Bearbeitung von Signalen |
EP0542711A1 (de) * | 1991-11-13 | 1993-05-19 | Viennatone Aktiengesellschaft | Verfahren zur Verschiebung der Frequenz von Signalen |
US6905225B2 (en) * | 2003-06-09 | 2005-06-14 | George S. Pearl | Floodlight and spotlight adapter and enclosure |
-
2001
- 2001-07-31 DE DE2001137395 patent/DE10137395C1/de not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0542710A1 (de) * | 1991-11-13 | 1993-05-19 | Viennatone Aktiengesellschaft | Verfahren zur Bearbeitung von Signalen |
EP0542711A1 (de) * | 1991-11-13 | 1993-05-19 | Viennatone Aktiengesellschaft | Verfahren zur Verschiebung der Frequenz von Signalen |
US6905225B2 (en) * | 2003-06-09 | 2005-06-14 | George S. Pearl | Floodlight and spotlight adapter and enclosure |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69627580T2 (de) | Verfahren zur Rauschverminderung in einem Sprachsignal | |
EP0912974B1 (de) | Verfahren zur verringerung von störungen eines sprachsignals | |
DE19747885B4 (de) | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion | |
DE112009000805B4 (de) | Rauschreduktion | |
DE69531710T2 (de) | Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen | |
DE2818204C2 (de) | Signalverarbeitungsanlage zur Ableitung eines störverringerten Ausgangssignals | |
DE69124005T2 (de) | Sprachsignalverarbeitungsvorrichtung | |
DE69632626T2 (de) | Adaptiver sprachsignalfilter | |
DE19948308C2 (de) | Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung | |
DE2719973C2 (de) | ||
DE69630580T2 (de) | Rauschunterdrücker und Verfahren zur Unterdrückung des Hintergrundrauschens in einem verrauschten Sprachsignal und eine Mobilstation | |
EP1258865B1 (de) | Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen | |
EP1647972A2 (de) | Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen | |
DE4330243A1 (de) | Sprachverarbeitungseinrichtung | |
DE2749132A1 (de) | Rauschfilter-anordnung | |
DE2626793A1 (de) | Verfahren zur bewertung stimmhafter und stimmloser zustaende eines sprachsignals | |
WO2001047335A2 (de) | Verfahren zur elimination von störsignalanteilen in einem eingangssignal eines auditorischen systems, anwendung des verfahrens und ein hörgerät | |
DE10157535B4 (de) | Verfahren und Vorrichtung zur Reduzierung zufälliger, kontinuierlicher, instationärer Störungen in Audiosignalen | |
EP1755110A2 (de) | Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System | |
DE60033039T2 (de) | Vorrichtung und verfahren zur unterdrückung von zischlauten unter verwendung von adaptiven filteralgorithmen | |
DE10137685C1 (de) | Verfahren zum Erkennen des Vorliegens von Sprachsignalen | |
EP1453355B1 (de) | Signalverarbeitung in einem Hörgerät | |
DE10137395C1 (de) | Verfahren zur Unterdrückung von Störschall | |
DE3230391C2 (de) | ||
DE10025655B4 (de) | Verfahren zum Entfernen einer unerwünschten Komponente aus einem Signal und System zum Unterscheiden zwischen unerwünschten und erwünschten Signalkomponenten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8100 | Publication of the examined application without publication of unexamined application | ||
8304 | Grant after examination procedure | ||
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: INTERTON ELECTRONIC HOERGERAETE GMBH, 51469 BE, DE |
|
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |