DE19531388C1 - Signaltrennungsverfahren und -einrichtung für nichtlineare Mischungen unbekannter Signale - Google Patents

Signaltrennungsverfahren und -einrichtung für nichtlineare Mischungen unbekannter Signale

Info

Publication number
DE19531388C1
DE19531388C1 DE19531388A DE19531388A DE19531388C1 DE 19531388 C1 DE19531388 C1 DE 19531388C1 DE 19531388 A DE19531388 A DE 19531388A DE 19531388 A DE19531388 A DE 19531388A DE 19531388 C1 DE19531388 C1 DE 19531388C1
Authority
DE
Germany
Prior art keywords
signals
values
unknown
time
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE19531388A
Other languages
English (en)
Inventor
Heinz Georg Prof Dr Schuster
Frank Ehlers
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE19531388A priority Critical patent/DE19531388C1/de
Application granted granted Critical
Publication of DE19531388C1 publication Critical patent/DE19531388C1/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H21/00Adaptive networks
    • H03H21/0012Digital adaptive filters
    • H03H21/0025Particular filtering methods
    • H03H21/0029Particular filtering methods based on statistics
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H21/00Adaptive networks
    • H03H21/0012Digital adaptive filters
    • H03H21/0025Particular filtering methods
    • H03H2021/0034Blind source separation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/43Electronic input selection or mixing based on input signal analysis, e.g. mixing or selection between microphone and telecoil or between microphones with different directivity characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/505Customised settings for obtaining desired overall acoustical characteristics using digital signal processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Radar Systems Or Details Thereof (AREA)

Description

1. Technisches Gebiet
In der Meßtechnik besteht fast immer das Problem, daß bei einer Messung nicht nur Signale einer einzelnen Quelle, sondern oft nur Mischungen aus den Signalen mehrerer Quellen durch die Detektoren aufgenommen werden können.
2. Stand der Technik
Eine Signaltrennung mit möglichst wenig a-priori-Information über die Signale wurde von Herault und Jutten in den folgenden Veröffentlichungen behandelt: C. Jutten and J. Herault, "Blind separation of sources, part I: An adaptive algorithm based on neuromatic architecture", Signal Processing, vol 24, No. 1 pp 1-10, July 1991; P. Common, C. Jutten, J. Herault, "Blind Separation of sources, part II: Problems statement", Signal Processing, vol 24, No. 1, pp 11-20, July 1991, E. Sorouchyari, C. Jutten, J. Herault, "Blind Separation of Sources, part III: Stability analysis, ", Signal Processing, vol 24, No. 1, pp 21-29, July 1991. Dabei wird das Problem von mit konstanten Faktoren linear überlagerten, zeitlich unverzögerten, unabhängigen Signalen beschrieben. Wie sich herausstellt, funktioniert das Verfahren nicht mit Gaußverteilten Signalen, das sind zum Beispiel Sprache oder Musik.
In der Veröffentlichung von Molgedey und Schuster (Molgedey L. und Schuster H. G. 1994: Separation of a Mixture of Independent Signals using Time Delayed Corelations, Phys. Rev. Lett. 72, 3634-3638.) wird die Trennung für unkorrelierte Signale, die zeitlich unverzögert linear überlagert sind, behandelt, die auch für Gauß'sche Quellen benutzt werden kann. Außerdem wird ein Verfahren zur Trennung von Mischung skizziert, bei denen die Quellsignale (zeitlich unverzögert) multipliziert sind.
Gilles Burell (Burell, Gilles 1992: Blind Separation of Sources: A Nonlinear Neural Algorithm, Neural Networks, Vol. 5, pp 937-.) schlägt einen weiteren Ansatz für die Trennung von Gemischen aus unabhängigen Signalen vor, in dem ein neuronales Netz speziell für eine bekannte Art der nichtlinearen, zeitlich unverzögerten Mischungen konstruiert wird. Das Verfahren zum Finden der richtigen Parameter für die Entmischung ist dem Backpropagationalgorithmus ähnlich.
In dem European Patent application number 93630032.6, date of filing 10. 04. 1992 by the inventors Ehud Weinstein and Daniel Yellin wird eine Signaltrennung für den Fall einer durch lineare Filter entstandenen Mischung unabhängiger und unkorrelierter Quellsignale beschrieben, und es werden zwei Berechnungsmöglichkeiten für die gesuchten Filter gegeben: 1. Eine iterative Lösung zweier "standard least square" Algorithmen und 2. ein rekursiver Algorithmus, der im Prinzip dem ersten äquivalent ist, aber weniger Rechenkapazität benötigt, dafür aber auch nicht exakt ist. Damit wird der von Platt und Faggin in (J. C. Platt and F. Faggin: Networks for the Separation of Sources that are Superimposed and Delayed, ed. John E. Moody "Advances in Neural Information Processing" Vol. 4, Morgan-Kaufman, San Mateo (1992).) vorgeschlagenen Algorithmus begründet und erweitert. In keiner uns bekannten Veröffentlichung wird das Problem einer a priori unbekannten nichtlinearen Mischung (Mischung durch ein beliebiges nichtlineares System) angeschnitten oder gar gelöst.
3. Zugrundeliegendes Problem
Die Erfindung betrifft ein Verfahren sowie eine Einrichtung zur Signaltrennung eines Signalgemisches der Form
das aus M unbekannten Quellsignalen ₁(t) . . M(t) besteht, die mit unbekannten Gewichtsfaktoren gs in der angegebenen Weise gemischt sind. Ein Schema dazu stellt Fig. Nr. 1 dar. 1 steht für den unbekannten Teil, bestehend aus den Quellprozessen, deren Signale durch ein nichtlineares System G 2 gemischt werden. 3 zeigt den bekannten Bereich an. In 4 werden aus einer Analyse der Meßdaten die Quellsignale entmischt und stehen als Ausgänge u₁ und u₂ zur Verfügung. Das Verfahren kommt fast ohne Annahme über die Quellsignale und das nichtlineare Mischungssystem aus, bis auf die Bedingung, daß eine statistische Analyse der empfangenen Mischungen aus den Quellsignalen ys(t) genügend Information für eine Trennung liefert. Beispielsweise wird die zeitlich unverzögerte Überlagerung zweier Gaußverteilter weißer Rauschsignale n₁(t) und n₂(t) mit unterschiedlichen konstanten Faktoren c₁₂ und c₂₁ in der Form
y₁(t) = n₁(t)+c₁₂n₂(t)
y₂(t) = n₂(t)+c₁₂n₁(t) (1)
nicht möglich sein, da ⟨y₁(t)y₂(t+τ)⟩ = 0 für τ≠0 und alle Korrelationen der Form ⟨yn₁(t)ym₂(t+τ)⟩ = 0 für m+n<2.
Die Beschränkungen werden im Verlauf dieser Beschreibung klarer werden, aber da eine Veränderung der gs durch eine geänderte Aufnahmetechnik möglich ist und da man es in den meisten Fällen mit der Trennung von Signalen, die Information enthalten, d. h. bei denen eine statistische Analyse höherer Ordnung Ergebnisse liefert, wie z. B. eine Trennung von Mischungen aus Sprache und Musik, zu tun hat, werden die Beschränkungen meistens ausräumbar bzw. vernachlässigbar sein.
4. Erfindnung
Eine beliebige nichtlineare Mischung kann durch die folgende Form beschrieben werden:
wobei die M Quellsignale ₁(t) . . . M(t) unbekannt und mit unbekannten Gewichtsfaktoren gs in der angegebenen Weise gemischt sind und wobei t∈R ist. Dies ist die Form einer Volterra-Reihe. Entsprechend einem Theorem von Frechet kann jedes stetige Funktional mit einer beliebigen Genauigkeit durch eine Volterra-Reihe approximiert werden. Zu dieser Reihe gibt es auch ein zeitdiskontinuierliches Analogon, das eine Anwendung der Erfindung auf digitale Systeme zuläßt.
Im folgenden wird nur der Fall betrachtet, in dem xj(t), ys(t), t∈R gilt. Eine Formulierung mit höherdimensionalen Variablen ist möglich, aber der eindimensionale Fall enthält alle wesentlichen Verfahrensschritte.
Das in dieser Erfindung beschriebene Verfahren besteht im wesentlichen aus zwei Schritten: Erstens werden die durch den wählbaren Grad der Nichtlinearität bei der Mischung eindeutig bestimmten nichtlinearen Gleichungen für ein gleitendes Zeitfenster gelöst und die Lösungen werden über die Zeit gemittelt, und zweitens wird ein aus einer genügend großen Anzahl von unterschiedlichen Kumulanten der geschätzten Ausgangssignale ui(t) gebildetes Potential minimiert, wobei die zur Berechnung des Potentials nötigen Werte aus einem gleitenden Zeitfenster einer wählbaren Länge stammen.
Zu erstens:
Eine mehrdimensionale Fouriertransformation von 2 ist möglich, und man erhält:
Genauso ist eine zeitvariable Fouriertransformation möglich, in der jeweils ein zeitlich begrenzter Ausschnitt der Größe T∈R aus dem Gesamtverlauf der Signale herausgeschnitten und fouriertransformiert wird. Dann erhält man:
Dabei ist vorausgesetzt, daß sich das System G so langsam ändert, daß diese Änderung bei der Berechnung der gesuchten Mischungsfaktoren vernachlässigt werden kann.
Um die Bedingungen zu formulieren, die die Quellsignale erfüllen müssen, damit das Verfahren im ersten Schritt angewendet werden kann, werden nun folgende Variablen definiert:
i,j,k,N₀,N₁,N₂∈N
ωÿ∈R
τÿk∈R(i₁, . . ., )∈{p∈N|1pM}(j₁, . . ., )∈(k₁, . . ., )∈((
Die Quellensignale müssen die folgenden Bedingungen erfüllen für einen genügend großen Bereich der oben definierten Variablen:
außer falls
i₁ = i₂ . . . =
und
= . . . =
gleichzeitig gilt.
Nun geht es darum, die in der obigen Gleichung stehenden unbekannten Größen zu berechnen. Man benötigt dieselbe Anzahl an Gleichungen wie an unbekannte Größen. Daher soll mit obiger Gleichung für ausreichend unterschiedlich viele Verzögerungszeiten τ₀ bis τE (E∈N) ein Gleichungssystem aufgestellt werden, d. h.:
oder entsprechende Gleichungen, die sich durch das Bilden der Erwartungswerte von beliebigen Produkten der zeitvariablen Fouriertransformierten der empfangenen Signale Ys(ω₁, . . ., ωn, T) und der zeitverzögerten zeitvariablen Fouriertransformierten der empfangenen Signale Ys (ω₁, . . ., ωn, T-τj) ergeben. Dadurch erhält man ein nichtlineares Gleichungssystem, das numerisch gelöst werden kann. Natürlich kann man durch die Berücksichtigung weiterer Werte für die Verzögerungszeiten τj mehr Gleichungen als unbedingt nötig aufstellen und dann die überbestimmten Lösungen einer Mittelwertbildung unterziehen.
An einem Beispiel soll nun die Verfahrensweise dieses ersten Schrittes gezeigt werden.
Das betrachtete System sei derart nichtlinear, daß gilt:
Dann ergeben sich durch das Bilden von Kreuzkorrelationen die folgenden Gleichungen (0jE) für ω₁, ω₂∈R und ω₁≠ω₂:
⟨Y₁(ω₁, ω₂, T)Y₂(ω₁, ω₂, T+τj)⟩ =
1,1(ω₁)⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩+
1,2(ω₁)⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
2,1,2(ω₁, ω₂)G²2,1,2(ω₁, ω₂)⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩⟨X₂(ω₂, T)X₂(ω₂, T+τj)⟩+
2,2,1(ω₁, ω₂)G²2,2,1(ω₁, ω₂)⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩⟨X₁(ω₂, T)X₁(ω₂, T+τj)⟩;
⟨Y₁(ω₁, ω₂, T)Y₁(ω₁, ω₂, T+τj)⟩ =
⟨X₁(ω₁, T)X₁(ω₁, T+τ)⟩+
(G¹1,2(ω))²⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
(G¹2,1,2(ω₁, ω₂))²⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩⟨X₂(ω₂, T+τj)⟩+
(G¹2,2,1(ω₁, ω₂))²⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩⟨X₁(ω₂, T)X₁(ω₂, T+τj)⟩;
⟨Y₂(ω₁, ω₂, T)Y₂(ω₁, ω₂, T+τj)⟩ =
⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
(G²1,1(ω₁))²⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩+
(G²2,1,2(ω₁, ω₂))²⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩⟨X₂(ω₂, T)X₂(ω₂, T+τj)⟩+
(G²2,2,1(ω₁, ω₂))²⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩⟨X₁(ω₂, T)X₁(ω₂, T+τj)⟩.
Entsprechend ergeben sich 3 weitere Gleichungen, wenn ω₁ und ω₂ vertauscht werden.
⟨Y₁(ω₂, ω₁, T)Y₂(ω₁, ω₂, T+τj)⟩ =
1,1(ω₂)⟨X₁(ω₂, T)X₁(ω₂, T+τj)⟩+
1,2(ω₂)⟨X₂(ω₂, T)X₂(ω₂, T+τj)⟩+
2,1,2(ω₂, ω₁)G²2,1,2(ω₂, ω₁)⟨X₁(ω₂, T)X₁(ω₂, T+τj)⟩⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
2,2,1(ω₂, ω₁)G²2,2,1(ω₂, ω₁)⟨X₂(ω₂, T)X₂(ω₂, T+τj)⟩⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩;
⟨Y₁(ω₂, ω₁, T)y₁(ω₂, ω₁, T+τj)⟩ =
⟨X₁(ω₂, T)X₁(ω₂, T+τj)⟩+
(G¹1,2(ω₂))²⟨X₂(ω₂, T)X₂(ω₂, T+τj)⟩+
(G¹2,1,2(ω₂, ω₁))²⟨X₁(ω₂, T)X₁(ω₂,T+τj)⟩⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
(G¹2,2,1(ω₂, ω₁))²⟨X₂(ω₂, T)X₂(ω₂, T+τj)⟩⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩;
⟨Y₂(ω₂, ω₁, T)Y₂(ω₂, ω₁, T+τj)⟩ =
⟨X₂(ω₂, T)X₂(ω₂, T+τj)⟩+
(G²1,1(ω₂))²⟨X₁(ω₂, T)X₁(ω₂, T+τj)⟩+
(G²2,1,2(ω₂, ω₁))²⟨X₁(ω₂, T)X₁(ω₂, T+τj)⟩⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
(G²2,2,1(ω₂, ω₁))²⟨X₂(ω₂, T)X₂(ω₂, T+τj)⟩⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩.
Für ein Paar (ω₁, ω₂) mit ω₁≠ω₂ ergeben sich 6E Gleichungen für 12+4E unbekannte Größen.
Im Fall, daß ω₁, ω₂∈R mit ω₁=ω₂ ist, ergeben sich durch das Bilden von Kreuzkorrelationen die folgenden Gleichungen (0jE):
⟨Y₁(ω₁, ω₁, T)Y₂(ω₁, ω₁, T+τj)⟩ =
(G²1,1(ω₁)⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩+
(G¹1,2(ω₁)⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
(G¹2,1,2(ω₁, ω₁)G²2,1,2(ω₁, ω₁)[X₁(ω₁, T)X₁(ω₁, T+τj)⟩⟨)X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
2,2,1(ω₁, ω₁)G²2,2,1(ω₁, ω₁)⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩+
2,1,2(ω₁, ω₁)G²2,2,1(ω₁, ω₂)⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩+
2,2,1(ω₁, ω₁)G²2,1,2(ω₁, ω₁)⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩;
⟨Y₁(ω₁, ω₁, T)Y₁(ω₁, ω₁, T+τj)⟩ =
⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩+
(G¹1,2(ω₁))²⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
(G¹2,1,2(ω₁, ω₁))²⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
(G¹2,2,1(ω₁, ω₁))²[X₂(ω₁, T)X₂(ω₁, T+τj)⟩⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩+
2,1,2(ω₁, ω₁)G¹2,2,1(ω₁, ω₁)⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
2,1,2(ω₁, ω₁)G¹2,2,1(ω₁, ω₁)⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩;
⟨Y₂(ω₁, ω₁, T)Y₂(ω₁, ω₁, T+τj)⟩ =
⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
(G²1,1(ω₁))⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩+
(G²2,1,2(ω₁, ω₁))²⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
(G²2,2,1(ω₁, ω₁))²⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩+
2,1,2(ω₁, ω₁)G²2,2,1(ω₁, ω₁)⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩+
2,1,2(ω₁, ω₁)G²2,2,1(ω₁, ω₁)⟨X₂(ω₁, T)X₂(ω₁, T+τj)⟩⟨X₁(ω₁, T)X₁(ω₁, T+τj)⟩.
Für ein Paar (ω₁, ω₂) mit ω₁=ω₂ ergeben sich 3E Gleichungen für 6+2E unbekannte Größen.
Beim Aufstellen dieses Gleichungssystems wurde davon Gebrauch gemacht, daß die Quellsignale die folgenden Bedingungen entsprechend Gleichung (3) erfüllen:
für alle ω₁, ω₂, τ∈R, und
cum (X₁(ω₁, T), X₁(ω₂, T-τ)) = 0
cum (X₂(ω₁, T), X₂(ω₂, T-τ)) = 0
für alle ω₁ ω₂, τ∈R mit ω₁≠ω₂.
Damit gilt dann:
⟨X₁(ω₁, T)X₂(ω₂, T)X₁(ω₁, T-τ)X₂(ω₂, T-τ)⟩ =
⟨X₁(ω₁, T)X₁(ω₁, T-τ)⟩⟨X₂(ω₂, T)X₂(ω₂, T-τ)⟩;
⟨X₂(ω₁, T)X₁(ω₂, T)X₂(ω₁, T-τ)X₁(ω₂, T-τ)⟩ =
⟨X₂(ω₁, T)X₂(ω₁, T-τ)⟩⟨X₁(ω₂, T)X₁(ω₂, T-τ)⟩;
⟨X₁(ω₁, T)X₂(ω₁, T)X₁(ω₁, T-τ)X₂(ω₁, T-τ)⟩ =
⟨X₂(ω₁, T)X₂(ω₁, T-τ)⟩⟨X₁(ω₁, T)X₁(ω₁, T-τ)⟩;
für alle ω₁, ω₂∈R. Außerdem gilt:
⟨X₁(ω₁, T)X₂(ω₂, T)X₂(ω₁, T-τ)X₁(ω₁, T-τ)⟩ = 0;
⟨X₂(ω₁, T)X₁(ω₂, T)X₁(ω₁, T-τ)X₂(ω₁, T-τ)⟩ = 0;
für alle ω₁, ω₂∈R mit ω₁≠ω₂.
Aufgrund von fehlerhaften Aufnahmen (zusätzliches Rauschen) bzw. Fensterungseffekten durch die zeitvariablen Fouriertransformation muß diese Berechnung für ein in geeignet großen Schritten über die Signale bewegtes Fenster wiederholt werden. Die entsprechenden Ergebnisse werden dann gemittelt, und die gemittelten Werte nähern sich so den wahren Werten an. Diese Annäherung kann aber viele Daten benötigen. Eine große Menge an Daten kann zu Problemen bei einer Realisierung führen, daher wird diesem ersten Schritt ein zweiter nachgestellt.
Zu zweitens:
Dieser zweite Schritt ist eine Anlehnung an die Methoden, die in der Signalverarbeitung mit neuronalen Netzen angewendet werden. Man konstruiert sich eine Kostenfunktion, die minimiert wird. Wenn das globale Minimum erreicht ist, hat man die optimalen Werte, in diesem Fall der Übertragungsfaktoren, gefunden. Für die Minimierung einer Kostenfunktion stehen beim heutigen Stand der Technik eine große Anzahl von Methoden zur Verfügung, z. B. Gradientenabstieg oder Monte-Carlo-Simulationen. Ein Nachteil aller Verfahren ist aber, daß sie in lokalen Minima der Kostenfunktion steckenbleiben können; der Vorteil unserer Erfindung ist, daß durch die Startwerte aus dem ersten Schritt die Minimierung schon in der Nähe des globalen Minimums beginnen kann, denn bei dem Ende der Berechnungen des ersten Schrittes liegen für die Übertragungsfaktoren geschätzte Werte vor, die sich nur wenig von den gesuchten Werten für die wahren Übertragungsfaktoren unterscheiden und die für eine bessere Trennung weiter optimiert werden.
Mit der Methode der Potentialminimierung werden Effekte von zusätzlichen Rauchprozessen verringert.
Um die Bedingungen zu formulieren, die die Quellsignale erfüllen müssen, damit das Verfahren im zweiten Schritt angewendet werden kann, werden nun folgende Variablen definiert:
i, j, N₀, N₁∈N (5)
τÿ∈R(i₁, . . ., )∈{p∈N|1pM}(j₁, . . ., )∈
Die Quellensignale müssen die folgenden Bedingungen erfüllen für einen genügend großen Bereich der oben definierten Variablen:
außer falls
i₁ = i₂ = . . . =
gilt.
Für den hier betrachteten Fall, die richtigen Übertragungsfaktoren zu finden, bilden wir eine Kostenfunktion derart, daß die Ausgänge eines adaptiven Filters ui(t) dieselben Bedingungen erfüllen müssen wie die Quellsignale i(t), d. h. für eine genügend große Anzahl von Werten der in 5 definierten Variablen werden die Quadrate der Kumulanten aus 6, dabei werden die Quellsignale durch die Ausgänge des Filters u ersetzt, aufsummiert, so daß eine Kostenfunktion entsteht, die minimiert wird. Optimiert werden dabei die Werte der Übertragungsfaktoren. Nach jedem Optimierungsschritt müssen die Werte für die ui(t) neu berechnet werden. Diese Berechnung kann im Zeit- oder Frequenzbereich erfolgen.
Zum Beispiel werden für den Fall, in dem folgende Mischung vorliegt:
Y₁(ω) = X₁(ω)+G₁₂(ω)X₂(ω)+K(ω)X₁(ω)X₂(ω);
Y₂(ω) = X₂(ω)+G₂₁(ω)X₁(ω)+K(ω)X₁(ω)X₂(ω)
die Ausgänge mit den geschätzten Werten für die Übertragungsfaktoren G*₁₂, G*₂₁ und K* berechnet durch Auflösen des Gleichungssystems:
Y₁(ω) = U₁(ω)+G*₁₂(ω)U₂(ω)+K*(ω)U₁(ω)U₂(ω);
Y₂(ω) = U₂(ω)+G*₂₁(ω)U₁(ω)+K*(ω)U₁(ω)U₂(ω)
nach U₁(ω) und U₂(ω).
Die durch das adaptive Filter zu minimierende Kostenfunktion V kann mit den Ausgängen u₁(t) und u₂(t) gebildet werden:
wobei B eine endliche Menge reeller Zahlen ist.
5. Gewerbliche Anwendbarkeit
Die durchzuführenden Berechnungen benötigen eine hohe Rechenkapazität, die aber schon heute mit Mikroprozessoren bereitsteht. Eine in parallelen Schritten ausgeführte Verwendung des angegebene Verfahrens eröffnet auch für höherfrequente Probleme ein Echtzeitrealisierung. Im offline Betrieb läßt sich das Verfahren auf frei programmierbaren Mikroprozessoren implementieren.
Anwendungsmöglichkeiten liegen in einer Signaltrennung als Vorverarbeitungsschritt für eine automatische Spracherkennung, bei der Konstruktion technischer Hörhilfen, sowie in allen anderen akustischen Messungen, einschließlich die der Unterwasserakustik.
Außerdem sind medizinische Anwendungsmöglichkeiten bei Mehrkanalmessungen wie EEG oder MEG (Fig. Nr. 2) möglich, sowie bei Antennenfeldern für die Aufnahme elektromagnetischer Strahlung. Wie in der Fig. Nr. 2 dargestellt, werden magnetische Dipole im Gehirn 2 durch SQUIDs 3 gemessen, und die Signale werden einer Auswerteeinheit 1 zugeführt.
Diesen und allen weiteren denkbaren Anwendungsmöglichkeiten ist gemeinsam, daß sie der bisher linearen Theorie verschlossen bleiben, weil eine lineare Signaltrennung zu unbefriedigenden Ergebnissen führt, denn aufgrund der Detektortechniken haben fast alle Empfänger eine nichtlineare Kennlinie. Weiterhin sind bei einer Formulierung mit mehrdimensionalen Variablen Anwendungen in der Optik bzw. Bildverarbeitung möglich, in der auch bei der Aufnahme nichtlineare Effekte auftreten.
Darüber hinaus können die berechneten Werte auch zu einer Analyse des mischenden Systems benutzt werden, z. B. zur Quellenlokalisierung oder Bewegungsdetektion.
6. Vorteilhafte Auswirkungen
Neben den schon in dem Abschnitt Gewerbliche Anwendbarkeit genannten möglichen Erneuerungen gibt es noch eine weitere Verbesserung: Um mit der bisher linearen Methode zu arbeiten, werden Empfindlichkeitsbereiche der Detektoren auf ihren linearen Bereich verkleinert. Dies ist bei der nichtlinearen Methode nicht nötig.
7. Ausführung
Stellvertretend für alle anderen Probleme wird der Fall der Trennung akustischer Signale behandelt. Entsprechend Fig. Nr. 1 stellt der mit 1 bezeichnete Block dann einen unbekannten Prozeß bestehend aus zwei Schallquellen dar, deren Signale durch den Raum zu zwei Mikrofonen gelangen, deren aufgenommene Signale aufgezeichnet werden und die Grundlage der der Erfindung entsprechenden Berechnungen bilden. Der Block, der mit 3 gekennzeichnet ist, enthält alle bekannten Größen. Das System G ist nichtlinear, weil zum einen die Raumübertragung nichtlinear sein kann, zum anderen die Mikrofone mit ihren Verstärkern eine nichtlineare Kennlinie besitzen. Die berechneten Signale u₁ und u₂ sind den Quellsignalen ₁ und ₂ ähnlich, so daß ein automatisches Spracherkennungssystem mit der aus der Mischung herausgetrennten Sprache funktioniert. Dies ist in der Fig. Nr. 3 sichtbar. Dort sind in den oberen beiden Kästen die Mischsignale von Sprache und Musik aufgezeigt, wie sie sich bei einer Mikrofonaufnahme in einem kleinen Raum ergeben. Im untersten Kasten ist das aus dem Gemisch herausgetrennte Sprachsignal am Ausgang der Trennungseinrichtung, dessen Berechnung auf einem der Erfindung entsprechenden Verfahren basiert, dargestellt; mit dem untersten Signal ist eine fehlerlose automatische Erkennung mit einem kommerziellen automatischen Spracherkenner möglich, während derselbe Erkenner bei den oberen beiden Signalen jeweils drei Fehler liefert.
8. Figurenbeschreibung
Fig. Nr. 1: 1 steht für den unbekannten Bereich, bestehend aus den Quellprozessen, deren Signale durch ein nichtlineares System G 2 gemischt werden. 3 zeigt den bekannten Bereich an. In 4 werden aus einer Analyse der Meßdaten die Quellsignale entmischt und stehen als Ausgänge u₁ und u₂ zur Verfügung.
Fig. Nr. 2: Magnetische Dipole im Gehirn 2 werden durch SQUIDs 3 gemessene, und die Signale werden einer Auswerteeinheit 1 zugeführt.
Fig. Nr. 3: In den oberen beiden Kästen sind die Mischsignale von Sprache und Musik aufgezeigt, wie sie sich bei einer Mikrofonaufnahme in einem kleinen Raum ergeben. Im untersten Kasten ist das aus dem Gemisch herausgetrennte Sprachsignal am Ausgang der Trennungseinrichtung, dessen Berechnung auf einem der Erfindung entsprechenden Verfahren basiert, dargestellt; mit dem untersten Signal ist eine fehlerlose automatische Erkennung mit einem kommerziellen automatischen Spracherkenner möglich, während derselbe Erkenner bei den oberen beiden Signalen jeweils drei Fehler liefert.

Claims (5)

1. Verfahren zur Separierung eines Signalgemisches der Form das aus M unbekannten Quellsignalen ₁(t) . . . M(t) besteht, die mit unbekannten Gewichtsfaktoren gs in der angegebenen Weise gemischt sind, für die Variable t soll gelten: t∈R, dadurch gekennzeichnet, daß ersten die durch den Grad der Nichtlinearität bei der Mischung eindeutig bestimmten nichtlinearen Gleichungen, die durch das Bilden von einer genügend großen Anzahl von unterschiedlichen Erwartungswerten von Produkten der zeitvariablen Fouriertransformierten der empfangenen Signale Ys(ω₁, . . ., ωn, T) und der um τj zeitverzögerten zeitvariablen Fouriertransformierten der empfangenen Signale Ys(w₁, . . ., ωn, T-τj) entstehen, für ein gleitendes Zeitfenster gelöst werden und die Lösungen über die Zeit gemittelt werden und daß zweitens ein aus einer genügend großen Anzahl von unterschiedlichen Kumulanten aus den geschätzten Ausgangssignalen ui(t) und aus den um τj zeitverzögerten geschätzten Ausgangssignalen ui(t-τj) gebildetes Potential minimiert wird, wobei die zur Berechnung des Potentials nötigen Werte aus einem gleitenden Zeitfenster einer wählbaren Größe stammen.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß über die Werte der Nichtlinearität g irgendwelche a-priori-Informationen bestehen, so daß die Berechnungen vereinfacht werden können.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß M=2 ist.
4. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeichnet, daß über die Werte der Quellsignale irgendwelche a-priori-Informationen bestehen, so daß die Berechnungen vereinfacht werden können.
5. Einrichtungen, dadurch gekennzeichnet, daß sie die Verfahren der Ansprüche 1 bis 4 in digitaler oder analoger Weise für eine Signaltrennung benutzen.
DE19531388A 1995-08-26 1995-08-26 Signaltrennungsverfahren und -einrichtung für nichtlineare Mischungen unbekannter Signale Expired - Fee Related DE19531388C1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19531388A DE19531388C1 (de) 1995-08-26 1995-08-26 Signaltrennungsverfahren und -einrichtung für nichtlineare Mischungen unbekannter Signale

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19531388A DE19531388C1 (de) 1995-08-26 1995-08-26 Signaltrennungsverfahren und -einrichtung für nichtlineare Mischungen unbekannter Signale

Publications (1)

Publication Number Publication Date
DE19531388C1 true DE19531388C1 (de) 1996-07-25

Family

ID=7770435

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19531388A Expired - Fee Related DE19531388C1 (de) 1995-08-26 1995-08-26 Signaltrennungsverfahren und -einrichtung für nichtlineare Mischungen unbekannter Signale

Country Status (1)

Country Link
DE (1) DE19531388C1 (de)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19549333A1 (de) * 1995-09-23 1997-03-27 Joerg Dr Arnold Differentielles Entstörverfahren von digitalen Signalen
WO1998041928A1 (de) * 1997-03-19 1998-09-24 Siemens Aktiengesellschaft Verfahren zur rechnergestützten extraktion statistisch unabhängiger digitaler signale aus digitalen eingangssignalen
WO2000025489A1 (de) * 1998-10-27 2000-05-04 Siemens Aktiengesellschaft Signaltrennungsverfahren und -anordnung für nichtlineare mischungen unbekannter signale
EP1018854A1 (de) * 1999-01-05 2000-07-12 Oticon A/S Verfahren und Vorrichtung zur Verbesserung der Sprachverständlichkeit

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0565479A1 (de) * 1992-04-10 1993-10-13 Ramot University Authority For Applied Research & Industrial Development Ltd. Vielkanalige Signaltrennung mit Kreuz-Polyspektren

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0565479A1 (de) * 1992-04-10 1993-10-13 Ramot University Authority For Applied Research & Industrial Development Ltd. Vielkanalige Signaltrennung mit Kreuz-Polyspektren

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HAYKIN, Simon: Adaptive Filter Theory, 2nd ed., Englewood Cliffs, New Jersey, Prentice-Hall, Inc., 1991, S.722-756 ISBN 0-13-013236-5 *
OPPENHEIM, Alan V., SCHAFER, Ronald W.: Discrete-Time Signal Processing, Englewood Cliffs, New Jersey, Prentice-Hall, Inc., 1989, S.768-825 ISBN 0-13-216771-9 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19549333A1 (de) * 1995-09-23 1997-03-27 Joerg Dr Arnold Differentielles Entstörverfahren von digitalen Signalen
WO1998041928A1 (de) * 1997-03-19 1998-09-24 Siemens Aktiengesellschaft Verfahren zur rechnergestützten extraktion statistisch unabhängiger digitaler signale aus digitalen eingangssignalen
WO2000025489A1 (de) * 1998-10-27 2000-05-04 Siemens Aktiengesellschaft Signaltrennungsverfahren und -anordnung für nichtlineare mischungen unbekannter signale
EP1018854A1 (de) * 1999-01-05 2000-07-12 Oticon A/S Verfahren und Vorrichtung zur Verbesserung der Sprachverständlichkeit
WO2000041441A1 (en) * 1999-01-05 2000-07-13 Oticon A/S A method and a device for providing improved speech intelligibility

Similar Documents

Publication Publication Date Title
DE69925905T2 (de) Blinde trennung von quellen durch faltung mit hilfe eines vielfachdekorrelationsverfahrens
DE3339288C2 (de)
DE3687677T2 (de) Geraeuschkompensation in einer spracherkennungseinrichtung.
DE3306730C2 (de)
DE69824230T2 (de) Verarbeitungssystem einer verrauschten Bildsequenz und medizinisches Untersuchungsgerät mit einem solchen System
DE10234130B3 (de) Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
DE10236898A1 (de) Videofiltern mit verbesserter Spur unter Verwendung von Wavelet-Entrauschungstechniken
EP0643289B1 (de) Untersuchungsverfahren zur Auswertung ortsabhängiger Spektren
DE19531388C1 (de) Signaltrennungsverfahren und -einrichtung für nichtlineare Mischungen unbekannter Signale
EP0700544B1 (de) Verfahren und einrichtung zur raumfilterung
DE3504890A1 (de) Verfahren und vorrichtung zur frequenzmessung durch zaehlung der anzahl von nulldurchgaengen
DE4123983C2 (de) Iteratives Verfahren zur hochauflösenden Spektralanalyse und Extrapolation von Signalen
DE4105517C2 (de) Verfahren und Vorrichtung zur verbesserten Wiedergabe von Konturen
DE2456245C2 (de) Schaltungsanordnung für ein digitales Filter
WO2000025489A1 (de) Signaltrennungsverfahren und -anordnung für nichtlineare mischungen unbekannter signale
DE2129421B2 (de) Schaltungsanordnung zur Verbesserung des Signal/Rausch-Abstandes von Signalen, die von mehreren Antennen empfangen werden
DE3740066C1 (de) Einrichtung zur Auffindung und Lokalisierung eines Bildausschnittes
DE19846453A1 (de) Verfahren zur Unterdrückung des Rauschens in Signalen
EP0943130B1 (de) Verfahren zur nichtstationären trennung von signalen unterschiedlicher quellen
DE4225401C1 (de) Verfahren zum Bestimmen spektraler Anteile eines Signals und Vorrichtung zur Durchführung des Verfahrens
EP0387507B1 (de) Einrichtung zur Umwandlung der Abtastraten von Digitalsignalen
DE3827696A1 (de) Vorrichtung zum aufzeichnen der welligkeitskurve einer messdatenkurve
DE2159180B2 (de) Verfahren und Vorrichtung zur Analyse einer Partikelprobe
DE3834871C1 (en) Method for encoding speech
DE69027619T2 (de) Fourier-Transformationsmethode mit Benutzung zahlentheoretischer Transformationen

Legal Events

Date Code Title Description
8100 Publication of patent without earlier publication of application
D1 Grant (no unexamined application published) patent law 81
8322 Nonbinding interest in granting licences declared
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee