DE102005001395A1

DE102005001395A1 - Transformation des frühen Schallfeldes

Info

Publication number: DE102005001395A1
Application number: DE200510001395
Authority: DE
Inventors: Helmut Oellers
Original assignee: Individual
Current assignee: Holoplot GmbH
Priority date: 2004-01-17
Filing date: 2005-01-12
Publication date: 2005-08-11
Anticipated expiration: 2025-01-13
Also published as: DE102004002532A1; DE102005001395B4

Abstract

Das Verfahren rekonstruiert die direkte Welle einer Schallwelle und ihre ersten schallstarken Reflexionen im Aufnahmeraum zeitlich korrekt und weitgehend amplituden- und richtungsgetreu in einem Wiedergaberaum, auch wenn sich die Räume in ihrer Dimension und in ihren Reflexionseigenschaften deutlich unterscheiden. Dadurch entsteht bei der Reproduktion beim Zuhörer ein akustischer Eindruck, der vom Ausgangsschallfeld kaum zu unterscheiden ist. Die akustischen Differenzen können deshalb ausgeglichen werden, weil die relevanten Parameter von Aufnahme- und Wiedergaberaum vor der eigentlichen Audioübertragung bekannt sind und in das gemeinsame System eingehen. So lässt sich die räumliche Struktur des Schallfeldes nach dem Huygensschen Prinzip der Wellenfeldsynthese allein durch eine frontal vor dem Zuhörer aufgestellte Lautsprechermatrix zeit- und richtungskorrigiert synthetisieren.
Diese Matrix reduziert das Schallfeld nicht, wie bei WFS-Anwendungen üblich, auf die horizontale Ebene des Zuhörers. Es wird in allen drei Raumdimensionen rekonstruiert.
Das System ist nicht an eine Zahl der Übertragungskanäle gebunden und kompatibel zu allen bekannten Verfahren. Auch bei deren Wiedergabe lässt sich ein realistischeres Schallfeld mit deutlich erweitertem sweet-spot generieren.
Der reproduzierte Aufnahmeraum kann sowohl größer als auch kleiner als der Wiedergaberaum sein.

Description

Teil a) Problembeschreibung
Die Audiowiedergabe mit Lautsprechern wurde in den letzten Jahrzehnten deutlich verbessert. Computergestützte Entwicklung und Fertigung sichern nun selbst im Konsumerbereich ausgezeichnete technische Parameter. Und dennoch: Auch die besten Anlagen versagen bis heute kläglich, verglichen mit dem Originalschallfeld.
Die Ursache hierfür kann nicht mehr in den Unzulänglichkeiten der Wandler selbst begründet sein. Offensichtlich gibt es Fehler im Übertragungssystem, die wir bei der Reproduktion des Schallfeldes nicht korrigieren.
Genau wie im Originalschallfeld erreicht uns von den Lautsprechern zuerst die direkte Welle. Über die Laufzeitunterschiede zu unseren Ohren können wir im Bereich von ca. 160 bis 3600 Hertz sofort sehr präzise die horizontale Richtung der Schallquelle bestimmen.
Dabei ist wichtig, dass diese Wahrnehmung nicht zu früh durch Reflektionen gestört wird. Wenn diese früher als 2 ms nach dem Primärschall eintreffen, verhindern sie nicht nur die präzise Ortung, sondern verwischen auch die Einschwingvorgänge und verändern dadurch den Klangeindruck völlig.
Das geschieht bei herkömmlichen Lautsprechern vor allem dann, wenn sie dicht an den Wänden des Wiedergaberaumes aufgestellt werden. Jenseits dieser Wände erzeugen sie kräftige Spiegelschallquellen, weil sie im Grundtonbereich relativ ungerichtet abstrahlen. Deren Wellenfronten überlagern sich mit der direkten Welle. Deshalb klingt ein und derselbe Lautsprecher in einem Raum gut, im anderen schlecht, je nachdem wie seine frequenzabhängige Richtcharakteristik mit der Raumakustik harmoniert.
Alle Versuche, die entstehenden Kammfiltereffekte im Frequenzgang dann wieder auszugleichen, bringen neue Probleme. Die Impulsantwort wird oft noch indifferenter und verhindert nun eine exakte Ortung der Punktschallquelle völlig. Zur Veranschaulichung ist in 1 dargestellt, welche Reflektionen den Zuhörer bei einer solchen Anordnung treffen, wenn eigentlich nur eine einzige Wellenfront dargestellt werden soll.
Wenn aber die ersten schallstarken Reflektionen im Zeitfenster zwischen ca. 5 und 50 Millisekunden nach der direkten Welle eintreffen, verfälschen sie den Klangeindruck nicht mehr. Im Gegenteil, sie werden noch direkt dem Primärschall zugeordnet und erhöhen so die subjektiv empfundene Lautstärke. Falls sie dazu aus deutlich anderer Richtung als der Primärschall eintreffen, sorgen sie für das durchsichtige, offene und räumliche Klangbild, wie wir es von realen Schallquellen kennen. Herkömmliche Lautsprecher können das nicht reproduzieren, weil sie diese Richtungsdifferenz nicht darstellen können.
Dabei ist gerade das der eigentliche Kern jeder Raumakustik, nicht nur in der horizontalen Ebene des Zuhörers, auf die alle herkömmlichen Lautsprecher-Wiedergabe-Verfahren reduziert sind. Unabdingbare Voraussetzung für eine wirklich authentische Reproduktion des Raumeindrucks ist es, dass die ersten schallstarken Reflektionen in allen Ebenen zeit- und richtungs- bezogen wiederhergestellt werden.
Die Elevation einer Schallquelle können wir vor allem über Reflektionen an unseren Ohrmuscheln und am Rumpf bestimmen. Diese frequenzabhängigen Ortungen sind nicht so exakt, wie die Laufzeitortung. Zudem sind sie individuell sehr verschieden, weil die Zuordnungen vor allem über optische Verknüpfungen erlernt werden.
Im Obertonbereich müssen wir uns auch in der horizontalen Ebene auf diese Hörerfahrung verlassen, weil mehrere Wellenlängen innerhalb des Ohrabstandes liegen und die Laufzeitortung deshalb nicht mehr eindeutig ist. Deshalb orten wir auch hier die Schallquellen amplitudenbezogen. Wir haben gelernt, Beugungs- und Abschattungseffekte am Kopf mit einer Richtungs-zuordnung zu verbinden. Dabei werten wir den Frequenzbereich über ca. 8 kHz nicht mehr aus.
Wie wichtig die zeitrichtige Staffelung der ersten schallstarken Reflektionen aber unterhalb dieser Frequenz ist, kann man in vielen Konzerthallen der Welt nachvollziehen. Treffen die ersten schallstarken Reflektionen nämlich zu spät, also mehr als ca. 60 ms nach dem Primärschall, beim Zuhörer ein, wird Sprache schwer verständlich und Musik indifferent und verwischt.
Nach ca. 100 ms ist die Richtung der Schallwellen nicht mehr von Bedeutung. Wir ordnen sie dann dem Nachhall zu, der zwar wichtige Infor-mationen zur Beschaffenheit des Raumes liefert, dessen räumliche Ortung aber eine untergeordnete Rolle spielt.
Deshalb ist es wenig sinnvoll, die Raumdarstellung zu sehr auf die Reproduktion des Nachhalls zu beschränken. Die Darstellung bleibt unglaubwürdig, solange die Lautsprecher der Audiowiedergabe die ersten schallstarken Reflektionen des Wiedergaberaumes aufprägen.

Aus der aufgezeigten Problematik wird deutlich, dass zur natürlichen Reproduktion eines primären Schallfeldes Anforderungen gestellt werden müssen, die herkömmliche Lautsprecherwiedergabe nicht befriedigend erfüllen kann:
Die räumliche Staffelung des Schallfeldes bleibt völlig dem Zusammenspiel von Lautsprecher und Abhörraum überlassen. Wegen ihrer weitgehend ungerichteten Abstrahlung im Grundtonbereich können herkömmliche Lautsprecheranordnungen nicht gewährleisten, dass der Direktschallanteil gegenüber verfrüht eintreffenden Reflektionen des realen Wiedergaberaumes ausreichend groß ist.

Deshalb reproduzieren sie nicht die akustischen Verhältnisse am Aufnahme-Ort, sondern prägen dem Schallereignis die Akustik des Wiedergaberaumes auf, was zwangsläufig zu völlig verfälschten Ergebnissen führen muss. Das Einschwingverhalten des Aufnahmeraumes, also die zeit- und richtungsbezogene Reproduktion seiner ersten schallstarken Reflexionen, können sie überhaupt nicht darstellen.

Solch eine gezielte Staffelung der Abstrahlung kann nur eine Lautsprecheranordnung bewirken, deren Ausdehnung sich mindestens über zwei Wellenlängen der abgestrahlten Frequenz erstreckt. Sie muss die Wellenfronten in der horizontalen und in der vertikalen Ebene gesteuert ausrichten können. Die exakte Reproduktion ist vor allem im Gesichtsfeld wichtig, weil wir Fehler hier am schnellsten wahrnehmen. [1]

Herkömmliche Lautsprecherboxen sind für eine authentische Reproduktion also schon deshalb ungeeignet, weil sie zu klein sind, um eine gezielte Richtcharakteristik im Grundtonbereich zu ermöglichen. Mit kohärent angesteuerten Lautsprechern kann eine solche Richtwirkung nur mit langen Schallzeilen erreicht werden, dann aber auch nur in ihrer Längsachse und nicht steuerbar. Weitaus bessere Möglichkeiten bietet das Verfahren der Wellenfeldsynthese, zu dem es gerade in den letzten Jahren weltweit intensive Forschungsarbeit gibt [2]. Die Einzelstrahler einer Lautsprechergruppe werden dabei durch eine Computersynthese einzeln und differenziert so angesteuert, dass sie gemäß dem Huygens'schen Prinzip wieder einen Ausschnitt einer primären Wellenfront generieren. Ihre Membranen werden dazu exakt zu dem Zeitpunkt ausgelenkt, zu dem auch die Wellenfront der realen Schallquelle ihren Raumpunkt durchlaufen würde.

Im Unterschied zu Einzellautsprechern, die nur instabile Phantomschallquellen generieren können, werden so virtuelle Schallquellen erzeugt, die sich in ihrer stabilen Ortbarkeit für den Zuhörer nicht von der Wellenfront des primären Schallfeldes unterscheiden.

Mit dem Verfahren können konvexe und konkave Wellenfronten generiert werden, so dass die Beschränkung herkömmlicher Wiedergabe, nach der die dichteste Schallquelle die Entfernung zum Lautsprecher haben kann, aufgehoben ist.

Auch parallele Wellenfronten können erzeugt werden, indem der Ausgangspunkt der virtuellen Quelle unendlich weit hinter die Lautsprecherfront verschoben wird, ohne die Amplitude entsprechend abzusenken.

Der Aufwand für diese Synthese ist groß, weil die Lautsprecher wegen sonst auftretender Aliasing-Effekte mit Frequenzgangverfälschungen an einzelnen Zuhörerplätzen nicht in zu großem Abstand voneinander montiert sein dürfen. Eine Schallquelle kann auch nur dargestellt werden, wenn sie sich vom Zuhörer aus gesehen innerhalb des Lautsprecherfeldes befindet. Wegen dieses truncation-Effektes werden die Lautsprecher Kreis- oder Rechteckförmig um den Zuhörer aufgestellt, um Schallquellen aus allen Richtungen darstellen zu können. [3] Deshalb ist es heute üblich, das Verfahren auf horizontale Strahlerzeilen zu reduzieren, was aber signifikante Einschränkungen nach sich zieht:
Die Reproduktion der Elevation von Schallquellen ist nicht mehr möglich. In der vertikalen Ebene haben die horizontalen Zeilen das gleiche ungerichtete Abstrahlverhalten wie einzelne Boxen. Bei einem Vergleich der Ausbreitung der Schallwelle einer realen Quelle mit der Wiedergabe einer solchen WFS-Zeile, wie in (2) dargestellt, wird deutlich, das die Kugelwellen der Einzelstrahler der Schallzeile zwar in der horizontalen Ebene die Wellenfront sehr exakt nachbilden, das aber in der vertikalen Ebene sehr starke Abweichungen entstehen.

Über die Decken-Reflektion des Wohnraumes treffen diese Wellenfronten in unserem Wohnraumbeispiel schon 3,34 Millisekunden nach der direkten Welle beim Zuhörer ein. Dagegen kommt diese Reflektion in dem akustisch günstigen Aufnahmeraum unseres Beispiels erst 22,7 ms nach ihr an, also in dem psychoakustisch günstigen Zeitfenster.

Genau wie konventionelle Lautsprecher hat die WFS-Zeile also in der Elevationsebene dem Schallereignis die ungünstige Akustik des Wiedergaberaumes aufgeprägt. Die tatsächliche Wellenfront des Aufnahmeraumes wird in dieser Ebene überhaupt nicht, oder nur mit einem Signal aus Richtung der Schallquelle, dargestellt. Der offene Schalleindruck des Aufnahmeraumes geht völlig verloren.

Zudem können von einer solchen Schallzeile nicht wirklich parallele Wellenfronten generiert werden. Es entstehen immer Zylinderwellen, deren Schalldruck mit Verdopplung der Entfernung um 3 dB abnimmt. Im Umkehrschluss ergibt sich daraus, dass der Pegel der Schallzeile deutlich zunimmt, wenn sich der Zuhörer dicht annähert, was zwangsläufig zur Einschränkung des sweetspots führen muss.

Der Schalldruck einer zweidimensional generierten parallelen Welle bleibt dagegen völlig konstant, egal ob der Zuhörer 10 Meter entfernt steht, oder unmittelbar vor der Strahlerfläche.

Praktisch aufgebaut wurde solch eine WFS-Strahlerfläche bereits 1997 an der Universität Tokyo. [4] Damit wurde ein Traum verwirklicht, den Experten schon in den dreißiger Jahren hatten, den sie damals aber für niemals realisierbar hielten – die Anordnung verwirklicht das Prinzip des akustischen Vorhangs (acustic curtain).

Die Lautsprechermembranen reproduzieren dabei den Schalldruck einer gleich angeordneten Fläche im Aufnahmeraum, so als ob auf einer Seite einer Wand Mikrofone angeordnet wären, die jeweils den zugehörigen Lautsprecher auf der anderen Seite der Wand ansteuern. Innerhalb dieses Fensters ist die Wiedergabe perfekt. Jedoch gilt auch hier die Einschränkung, dass die wiedergegebene virtuelle Schallquelle vom Zuhörer aus gesehen innerhalb der Lautsprecheranordnung plaziert sein muss.

Trotzdem kann nicht der akustische Eindruck des Aufnahmeraumes erzeugt werden. Die Beschränkung auf den Ausschnitt vermittelt eher den Eindruck, das man durch ein offenes Fenster in das Opernhaus hineinhören könne, weshalb man aber doch nicht die akustische Wahrnehmung verliert, das man immer noch freien steht.

Sicher ließe sich die Anordnung, wie die WFS-Lautsprecherzeilen, über alle wände des Wiedergaberaumes ausdehnen. Das brächte aber zwei neue Probleme:
Die fensterlosen, unmöblierten Räume wären nicht besonders wohnlich, was die Akzeptanz für ein solches System drastisch senken würde. Zudem würden die gleichen Probleme entstehen, die schon bei den WFS- Zeilen relativ erfolglos bekämpft werden:
Die generierten Schallwellen werden von der jeweils gegenüberliegenden Wand reflektiert und schaffen damit wieder das Problem der viel zu frühen schallstarken Reflexionen. Bei den WFS- Schallzeilenanordnungen wird der Effekt durch sehr starke Bedämpfung der Wiedergabe-Räume gemildert, was wiederum der Wohnlichkeit nicht unbedingt förderlich ist. Versuche zur elektronischen Kompensation brachten nur wenig Erfolg. [5]

Die übliche Betrachtung eines Übertragungssystems beginnt beim Mikrofon und endet beim Lautsprecher. Die Akustik des Abhörraumes und die Position des Zuhörers haben höchstens noch Einfluss auf den eingestellten Gesamtfrequenzgang.

Dabei hat der Wiedergaberaum den maßgeblichsten Einfluss auf die Qualität der Gesamtwiedergabe. Der größte Anteil der Signalverfälschungen in der gesamten Übertragungskette entsteht, nachdem die Lautsprecher ihre Arbeit getan haben.

Weil aber die akustischen Parameter dieses Übertragungsgliedes bei keinem bekannten Wiedergabesystem differenziert in die Übertragungskette einbezogen werden, gibt es auch keine Möglichkeit, seine Fehler gezielt zu korrigieren.

Teil b) Problemlösung

Es ist deutlich geworden, dass das Prinzip der Wellenfeldsynthese der einzige Ausgangspunkt bei dem Versuch sein kann, das Schallfeld eines Aufnahmeraumes in einen völlig anderen Wiedergaberaum zu transformieren. Das Prinzip darf aber nicht auf eine einzelne Schallzeile reduziert werden, wenn wir ein dreidimensionales Schallfeld erzeugen wollen.

Deshalb müssen wir eine zweidimensionale Lautsprechermatrix aufbauen, die frontal vor dem Zuhörer, möglicherweise versteckt hinter einer Projektionswand, aufgestellt wird. Ihre Ausdehnung sollte aber deutlich über die Fläche einer solchen Bildwand hinausgehen.
Ihre Einzelstrahler sollten in einem Frequenzbereich von etwa 160 Hertz bis ca. 8 kHz linear arbeiten und möglichst einen Membrandurchmesser unter 2 Zoll haben, um im gesamten Arbeitsbereich eine homogene Halbkugelwelle erzeugen zu können. Über 8 kHz übernehmen zwei hochwertige Hochtonlautsprecher links und rechts, weil die räumliche Ortung in diesem Bereich untergeordnet ist. Ein Subwoofer ergänzt im Bassbereich.
Der Abstand der Matrixlautsprecher zueinander bestimmt die Aliasing-Frequenz. Er sollte nicht unter 20 cm liegen, 10 cm wären besser, was aber den vierfachen Aufwand bedeutet.
Auch bei ca. 20 cm Abstand ist ihre Zahl in üblichen Räumen schon deutlich dreistellig, so dass die Einzelstrahler nur noch wenig zur Gesamtschalleistung beitragen müssen. Wenige Watt Leistung sind deshalb für die Einzelendstufen, die jedem Lautsprecher zugeordnet sein müssen, völlig ausreichend. Sie können mit einer gemeinsamen Betriebsspannung versorgt werden, auch die digitale Ansteuerung kann über eine gemeinsame Busleitung erfolgen. Handelsübliche Schaltkreise können heute als De-Multiplexer bis zu 192 Kanäle aus einem gewöhnlichen KAT5-Kabel aus einem solchen Bus ausfiltern und sie sind dabei recht preiswert.
Der Ansteuerbus kommt, wie bei den linearen WFS-Systemen, vom WFS-Renderer, einer leistungsfähigen Signalprozessoranordnung, die aus Inhalt und Form, also den bis dahin getrennt verarbeiteten Daten von reinem Audiosignal und den Positionen der zugehörigen virtuellen Schallquellen, die einzelnen Ansteuersignale für die Lautsprecher erzeugt.
Damit ist die Hardware festgelegt, mit der wir das transformierte Schallfeld auf der Wiedergabeseite erzeugen wollen. Auf den ersten Blick scheint dieser Versuch aussichtslos, vor allem deshalb, weil die Lautsprechermatrix auf eine einzige Wand dieses Raumes beschränkt sein soll.
Der „truncation" – Effekt, also die Einschränkung der Abstrahlung auf den Bereich innerhalb der Lautsprecheranordnung, würde bei einer solchen Anordnung eine Lösung unmöglich machen, solange wir sie als Wiedergabesystem einzeln betrachten. Sehen wir aber den Wiedergaberaum nicht mehr als störenden Faktor, den wir mit möglichst dicken schwarzen Tüchern oder leeren Eierkartons ausschalten wollen, ergeben sich völlig neue Möglichkeiten:
Der truncation-Effekt ist immer auf die Position des Zuhörers bezogen. Geht der beispielsweise zur rechten Wand, vorn neben der Matrix, kann er einen ganz anderen Bereich, bis weit links neben der Matrix hören.
Eine dort positionierte Schallquelle trifft natürlich auch rechte Seitenwand und wird von der reflektiert. Schon bei im Heimbereich problemlos realisierbaren, Diagonalen von 3 bis 4 Metern ist die Richtwirkung der Matrix auch im Grundtonbereich so hoch, dass – dem truncation-Effekt sei Dank – der Zuhörer nicht direkt von der Wellenfront getroffen wird.
Das funktioniert natürlich genauso mit der linken Wand, der Decke und dem Fußboden.
Aus den Spiegelschallquellen der Lautsprecher im Wiedergaberaum, die uns bisher so gestört haben, sind in dieser Betrachtung völlig unabhängig ansteuerbare Schallquellen geworden, die uns ganz neue Möglichkeiten für die Gestaltung des Schallfeldes bieten.
Um sie zu nutzen, müssen ihre Eigenschaften bekannt sein. Nach der Installation der frontalen Lautsprecherwand müssen deshalb alle relevanten Parameter des Wiedergaberaumes in das System eingegeben werden.
Für die spätere Schallfeldsynthese werden neben den geometrischen Daten des Wiedergaberaumes auch die Reflektionsfaktoren der Wände, getrennt angegeben für jede Oktave des Wiedergabebereiches, erfasst. In der Praxis wird das recht einfach sein, das Anklicken des jeweiligen Materials in einem entsprechenden Computerprogramm genügt. Die Möglichkeit, statt dieses datenbasierten Modells die Impulsantwort der Räume zu verarbeiten, ist hier weniger geeignet.
Auch die Position des Zuhörers muss festgelegt werden. Wir brauchen für eine Transformation unbedingt einen festen Bezugspunkt. Erst an den Ohren des Zuhörers auf diesem Platz darf unsere Systembetrachtung enden. Hier müssen wir die gleichen Verhältnisse schaffen, wie an einem, ebenfalls festzulegenden Punkt, an dem sich unser Zuhörer im Aufnahmeraum befindet.
Dieser festgelegte Widergabeplatz soll nicht die einzige stelle im Raum werden, auf dem eine hochwertige Reproduktion möglich ist. Er muss vielmehr der Mittelpunkt eines möglichst großen sweet-spot's für die Wiedergabe sein.
Von der Aufnahmeseite benötigen wir für die Transformation der ersten schallstarken Reflektionen die Audiosignale der einzelnen Schallquellen. Für jede Schallquelle ist ein separater Kanal erforderlich, wobei Einzelquellen zusammengefasst werden können, wenn sie räumlich eng benachbart sind. In die Transformation müssen auch ihre momentane Position, ihre polare Richtcharakteristik und ihre momentane Ausrichtung eingehen. Die polare Richtcharakteristik kann den statischen Daten zugeordnet werden, weil sie sich während des Zeitraumes der Übertragung nicht ändert. Diese Daten werden vor dem Beginn der eigentlichen Audioübertragung übermittelt.
Sie müssen nicht jedes Mal neu übertragen werden, wenn sie auf der Wiedergabeseite bekannt sind. Richtcharakteristiken aller erdenklichen Schallquellen zum Beispiel, könnten in Bibliotheken auf der Wiedergabeseite abgelegt sein und durch entsprechende Codes der jeweiligen Schallquelle zugeordnet werden.
Die momentane Position und die momentane Ausrichtung der Schallquelle müssen den dynamischen Daten zugeordnet werden, die während der Übertragung in kurzen Zeitabständen aktualisiert werden. Schließlich macht es für den Zuhörer einen deutlich anderen Schalleindruck, wenn Carruso sich unerwartet umdreht und seine Arie gegen die Kulissen schmettert.
Wie auf der Wiedergabeseite muß für die Transformation auch eine Position und Ausrichtung des Zuhörers im Aufnahmeraum festgelegt werden. Das kann der akustisch günstigste Platz sein. Zusammen mit einer Bildübertragung ist es aber sinnvoller, wenn deren Position und Ausrichtung mit der Bildübertragung korrespondiert.
Mit Änderung dieser Koordinaten ändert sich Abstand, Einfallswinkel und Pegel aller Wellenfronten bei diesem Zuhörer sowohl für die direkten Wellen von den einzelnen Schallquellen als auch für alle von den Spiegelschallquellen des Raumes ausgehenden Schallwellen. Wenn es gelingt, diese Änderungen auf den Zuhörer im Wiedergaberaum zu übertragen, könnte mit der Veränderung eines einzigen Datenblocks seine akustische Perspektive auf jeden beliebigen Punkt im Aufnahmeraum verschoben werden. Und wenn er wollte, könnte er das mit seiner Fernbedienung auch selbst tun.
Die Positionen der Spiegelschallquellen, die ein Schallereignis im Aufnahmeraum durch die Reflektionen an seinen Begrenzungsflächen erzeugt, spielt eine Schlüsselrolle bei der Transformation des Schallfeldes. Gelingt es, bei der wiedergabeseitigen Synthese virtuelle Schallquellen scheinbar von diesen Positionen ausgehen zu lassen, so erzeugen sie an der Zuhörerposition im Wiedergaberaum die gleiche Impulsantwort, die auf den Zuhörer im Aufnahmeraum einwirkt.
Weil auch die direkte Welle mit dem akustischen Vorhang ziemlich perfekt nachgebildet werden kann, entsteht so ein völlig realistisches Abbild des Schallfeldes, soweit auch Amplituden und Einfallswinkel dieser Wellenfronten übereinstimmen.
Nur mit der frontalen Lautsprechermatrix können wir diese Spiegelschallquellen allerdings nicht an allen Raumpositionen generieren. Mit den unabhängig steuerbaren Spiegelschallquellen der Matrix gelingt es aber, ein sehr ähnliches Schallfeld zu erzeugen.
In 3 stellt der äußere Quader wieder unseren Aufnahmeraum dar. Der kleinere Wiedergaberaum wurde zur Erläuterung so in diesen Saal eingezeichnet, dass die für unsere Übertragung festgelegten Positionen der Zuhörer im Saal und zu Hause übereinstimmen. An dieser Position wollen wir übereinstimmende Signale erzeugen.
Der Ausgangspunkt der direkten Welle liegt im Bereich des akustischen Vorhangs, sie wird deshalb exakt dargestellt. Jedoch liegt die Position der Spiegelung der primären Schallquelle im Aufnahmeraum außerhalb des darstellbaren Bereiches, weit entfernt vom Bereich der Lautsprechermatrix, aber doch nicht allzu weit vom Bereich unserer unabhängig ansteuerbaren Spiegelschallquelle.
Also müssen wir sie in einem ersten Schritt in diesen Bereich verschieben, um sie so gut wie möglich darstellen zu können. Das geschieht auf einer Kreisbahn um unseren festgelegten Zuhörerpunkt. Diese Verschiebung muß aber ausreichend weit in diesen Bereich hinein erfolgen, weil sich der Zuhörer sonst im Randbereich des jeweiligen sweet-spots befände.
Wichtig ist vor allem, dass die Entfernung zum Zuhörer und damit die Zeit unverändert geblieben ist, zu der die Welle beim Zuhörer eintrifft.
Weil im Bereich über der Wohnzimmerdecke keine realen Lautsprecher existieren, müssen wir die festgelegte Position nun im zweiten Schritt an der Zimmerdecke spiegeln. In 4 ist das dargestellt. Da dem System die Dimensionen des Wiedergaberaumes bekannt sind, lässt sich die endgültige Position unserer virtuellen Schallquelle nach den einfachen Regeln der Geometrie berechnen.
Damit hat der WFS-Renderer alle Informationen, die er braucht um die Einzellautsprecher anzusteuern. Er muß das zur Spiegelschallquelle zugehörige Audiosignal nur noch um die berechnete Schall-Laufzeit von ihrem Ausgangspunkt bis zum jeweiligen Lautsprecher verzögern.
Natürlich wird ein Teil dieser Wellenfront von der Zimmerdecke in Wärme umgewandelt, weshalb sie nie beim Zuhörer ankommt. Das passiert aber im Aufnahmeraum auch. Sind die Reflektionsfaktoren in beiden Räumen gleich, muss die Amplitude unserer virtuellen Spiegelquelle nur mit der Übertragungsfunktion der entsprechenden Wand des Aufnahmeraumes korrigiert werden.
Sind die Materialien beider Decken unterschiedlich, kann ihr Frequenzgang leicht in den einzelnen Oktaven um die Differenz der Reflektionsfaktoren korrigiert werden. Hat beispielsweise unser Aufnahmeraum bei einer bestimmten Frequenz einen Reflektionsfaktor von 0,9, unsere Wohnzimmerdecke aber nur 0,7, so muß der Pegel unserer virtuellen Spiegelschallquelle um 20 log (0,9/0,7), also um 2,2 dB, angehoben werden. Zusätzlich wird dieser Pegel nach den Gesetzen der Kugelwellenausbreitung und um den Betrag der Luftschalldämmung für ihren virtuellen Teil der Weglänge bis zum jeweiligen Lautsprecher reduziert.
Die polare Richtcharakteristik der zugehörigen Schallquelle geht in die Synthese ein, indem die Amplitude der virtuellen Spiegelschallquelle frequenzabhängig um den Betrag der Pegelabsenkung in ihrem polaren Richtdiagramm im zugehörigen Raumwinkel reduziert wird.
Nach dem gleichen Prinzip wandern dann die Ausgangspunkte der virtuellen Quellen für die Boden-Reflexion von unten nach oben und die für die Seitenwände von links nach rechts und umgekehrt.
Die Reflexion der Vorderwand kann direkt innerhalb der Matrix erzeugt werden, während die Darstellung der Reflexion der Rückwand ohne hintere Lautsprecher schwieriger darzustellen ist. Für diese wird die Wellenfront, wie in 4 dargestellt, doppelt gespiegelt. Erst an der Decke und dann an der Rückwand. Wegen des „truncation"-Effektes trifft sie dabei den Zuhörer auf ihrem Hinweg kaum. Die Reflexionsfaktoren der Rückwände werden wieder verrechnet, die Absorption der Wiedergaberaum-Decke wird durch entsprechende frequenzabhängige Pegelanhebung ausgeglichen.
Soweit möglich, sollte die Rückwand des Wiedergaberaumes im oberen Bereich schallhart sein. Darunter könnte ein Sofa, ein offenes Bücherregal oder ein Wandteppich die direkte Welle absorbieren.
Verläßt unser Zuhörer zu Hause seinen Bezugspunkt, so ändert sich sein Abstand zur virtuellen Schallquelle und zu all ihren Spiegelschallquellen. Die Laufzeiten zu ihnen und damit die Impulsantwort an seiner aktuellen Raumposition verändern sich in der gleichen Weise, wie sie sich im Aufnahmeraum für unseren virtuellen Zuhörer verändern würde, wenn er seinen Platz verläßt. Setzt er sich zu Hause also einen Platz nach rechts, so hat er den gleichen Schalleindruck wie der rechte Nachbar unseres virtuellen Zuhörers im Aufnahmeraum. Die Größenverhältnisse dieser Ortsveränderung sind nicht transformiert worden, also kann unser Zuhörer im Schallfeld nicht mehr als fünf Plätze nach rechts gehen, weil er dann gegen eine Wand läuft.
Und noch zwei Einschränkung hat er: Er darf in den Bereichen, in denen Wellenfronten der Spiegelschallquellen auf dem Weg zu den Zimmerwänden sind, also unmittelbar rechts oder links neben der Lautsprechermatrix, nicht mit einer hochwertigen Wiedergabe rechnen. Hier erreichen ihn Wellenfronten zur falschen Zeit aus falschen Richtungen, so wie wir es von herkömmlicher Lautsprecherwiedergabe gewöhnt sind.
Und er kann die direkte Schallquelle nicht hören, wenn er den truncation-Bereich des akustischen Vorhanges verläßt. Diese Einschränkung ist bedeutsamer, weil sie den sweet-spot für die Wiedergabe seitlich einschränkt, wenn sich eine virtuelle Quelle dicht neben ihrem Rand befindet.
Soll trotzdem eine Schallquelle weit seitlich dargestellt werden, so können wir uns als Kompromißlösung wieder unserer unabhängig steuerbaren, virtuellen Spiegelschallquellen der Matrix bedienen: So kann zum Beispiel sehr weit rechts eine virtuelle Schallquelle positioniert werden, indem nach dem beschriebenen Verfahren ihr Ausgangspunkt an der rechten Wand nach links gespiegelt wird.
Die Amplitudenverfälschung durch die Wandreflexion wird mit der inversen Übertragungsfunktion dieser Wand kompensiert. Jedoch kann die rechte Seitenwand-Reflexion dieser Quelle nur noch aus Richtung der Quelle selbst generiert werden. Aber im korrekten Abstand, so das der Fehler nur dem geübten Hörer auffallen wird.
Weiterer Nachteil dieser Methode ist es, dass der relative Winkel der Schallwellen zur Achse der Matrix größer ist. Damit verschiebt sich die Aliasing-Frequenz bei gegebenem Einzelstrahlerabstand nach unten. Eine Signalverfälschung, die allerdings bei einer zweidimensionalen Matrix geringer ist als bei den Line-Arrays: Werden die Einzelstrahler nämlich nicht im Raster, sondern wabenförmig angeordnet, erhöhen die benachbarten Strahler die horizontale Aliasing- Frequenz um den Faktor 1,4.
Je nach vertikaler Ausrichtung der Wellenfront sind sie im Winkel der Nullstelle nicht in Phase, wenn eine Wellenfront die Matrix seitlich durchläuft. Dadurch sinkt die Amplitude in diesem Winkel zwar deutlich, aber geht nicht bis auf Null zurück. Der Aliasing- Effekt erzeugt am Zuhörerplatz einen Kammfiltereffekt im Frequenzgang, für den unser Ohr nur wenig empfindlich ist, solange es keine ausgesprochenen Nullstellen gibt.
Im Wiedergaberaum hat das beschriebene Verfahren ein Schallfeld geschaffen, dessen Impulsantwort im wichtigen Zeitabschnitt bis zu etwa 100 ms nach der direkten Welle mit der Impulsantwort des Aufnahmeraumes übereinstimmt. Lediglich einige Einfallswinkel der Reflexionen haben sich geändert, wenn die Dimensionen der Räume sehr unterschiedlich sind oder wenn sich ihre Ausgangspunkte weit seitlich vom Zuhörer oder direkt über ihm befinden. Innerhalb dieses, in der Psychoakustik als „cone of confusion" bezeichneten Bereich ist unsere Ortung aber ohnehin sehr unpräzise.
Der Nachhall kann dann wieder mit dem primären Schallsignal übertragen werden, da seine Einfallsrichtung ohne Bedeutung ist. Er erreicht uns dann auch von den Spiegelschallquellen, was seiner unregelmäßigen Verteilung im Aufnahmeraum sehr nahe kommt.
Einen verbotenen Bereich sollte es für alle virtuellen Schallquellen geben: Werden sie direkt in der Ebene der Lautsprechermatrix plaziert, so muß ein einzelner Lautsprecher fast die gesamte Schalleistung erzeugen. Deshalb müßten alle Einzelelemente der Matrix in der Lage sein, diese Leistung verzerrungsfrei zu erzeugen. Die Anlage würde dann wesentlich aufwendiger. Deshalb sollten diese virtuellen Quellen grundsätzlich um ein oder zwei Lautsprecherabstände nach hinten verschoben werden, damit mehrere Lautsprecher zusammenarbeiten und so auch mit weniger leistungsfähigen Einzelstrahlern eine gute Gesamtdynamik erzielt werden kann.
Im System an sich ist nicht festgelegt, wie viele Primärsignale gleichzeitig übertragen werden. Schon eine einzelne Quelle, also ein Mono-Kanal kann sehr authentisch dargestellt werden, wenn bei der Reproduktion auch alle Zusatzinformationen von der Aufnahmeseite vorliegen. Die Eigenschaften der Wiedergabeseite sind ohnehin im System gespeichert. Die dynamischen Zusatzinformationen müssen auf die jeweilige Quelle bezogen sein, die Raumdaten werden gemeinsam genutzt.
Mit den heutigen digitalen Übertragungsverfahren ist die Übertragung dieser Zusatzinformationen problemlos möglich. Läßt ein Übertragungssystem aber die simultane Übermittlung nicht zu, können sie auch getrennt übermittelt und gespeichert werden. Beispielsweise über das Internet.
Wird eine Aufzeichnung übertragen, so sind auch die dynamischen Zusatzdaten für die gesamte Laufzeit schon vor Beginn der Übertragung bekannt. Sie können also schon vor dem Start der Wiedergabe übermittelt und abgespeichert werden. Über eine time-line lassen sie sich dann leicht mit der Wiedergabe verknüpfen.
Dann kann also unser virtueller Carruso durch die Mailänder Scala wandern und dabei nach belieben seinen Kopf drehen, selbst wenn sein Originalton nur von einer alten Monoaufnahme stammt.
Teil c) Praktische Anwendungsmöglichkeiten
Mit dem beschriebenen Verfahren gelingt, bei entsprechend produziertem Programmaterial, eine sehr authentische Reproduktion eines Schallereignisses. Schon wenige separate Übertragungskanäle sind für viele Anwendungen ausreichend. Meist sind nicht viele einzelne Schallquellen gleichzeitig aktiv. Ihre Wiedergabe wird nicht den Eindruck erwecken, dass nur wenige Monokanäle übertragen würden, denn jede primäre Schallquelle erzeugt ihr eigenes, dreidimensionales Schallfeld.
Über die Zahl der Übertragungskanäle hinaus können Schallereignisse dann dargestellt werden, wenn sie von dicht benachbarten Quellen stammen und einen gemeinsamen Kanal benutzen, oder wenn sie nicht gleichzeitig mit einer anderen Schallquelle aktiv sind. Die Zusatzdaten wechseln dann temporär auf die andere Quelle.
Nur wenige Übertragungen werden in absehbarer Zeit direkt für das beschriebene Verfahren produziert sein. Solange ist es wichtig, dass herkömmliche Aufnahmen, ergänzt durch nachträgliche Zusatzinformationen, deutlich realistischer reproduziert werden können.
Wie weiter oben beschrieben, kann durch die Transformation des frühen Schallfeldes selbst eine alte Monoaufnahme in einer völlig neuen akustischen Dimension dargestellt werden. In dieser Weise kannte auch der Center-Kanal einer sourround-Wiedergabe, in Korrespondenz zur zugehörigen Bildinformation, deutlich aufgewertet werden.
Für die linken und rechten Kanäle wird, genau wie bei der Stereowiedergabe, abhängig vom Genre ein akustisch passender, virtueller Aufnahmeraum aus der Bibliothek ausgesucht. In diesem Raum wird wieder ein Zuhörer plaziert, vor dem die linken und rechten Lautsprecherboxen als virtuelle Schallquellen, sogenannte virtual panning spots, aufgestellt sind.
Der Rest der Reproduktion unterscheidet sich nicht von der einer natürlichen Schallquelle an dieser Position. Es lassen sich dann noch die gröbsten Fehler der nun wieder "herkömmlichen", virtuellen Lautsprecherwiedergabe in einem virtuellen Raum, elektronisch ausgleichen.
Analoges gilt für die, über die Decken- Reflexion generierten, hinteren Lautsprecher. So steht insgesamt für die Wiedergabe von herkömmlichen sourround- Produktionen ein Verfahren zur Verfügung, das nicht nur kompatibel ist, sondern das die Wiedergabe signifikant verbessert.
Es entsteht ein wesentlich vergrößerter sweet-spot, der fast auf den gesamten Wiedergaberaum ausgedehnt ist, weil die Winkel-Änderungen und die relativen Abstands-Änderungen zu den weiter entfernten „ Boxen" deutlich geringer sind, als bei realen Lautsprechern im Wiedergaberaum, wenn sich der Zuhörer darin bewegt.
Die bisherige Beschreibung hat nur aufgezeigt, wie ein größerer Aufnahmeraum in einem kleineren Wiedergaberaum dargestellt werden kann. Sicher der Regelfall für Heimwiedergabe. Dabei werden von der Lautsprechermatrix frühe Reflektionen nachgebildet, die gegenüber der direkten Welle verzögert abgestrahlt werden.
Doch auch der umgekehrte Fall ist ohne Modifikationen am System möglich, selbst die beschriebenen Algorithmen zur Positionierung der virtuellen Spiegelschallquellen bleiben gleich.
Die Samples der digitalisierten Audiokanäle werden in WFS- Systemen ohnehin für einige hundert Millisekunden zwischengespeichert, um sie für die einzelnen Lautsprecher sequentiell auslesen zu können. Also spielt es auch keine Rolle, ob zuerst die direkte Welle und dann die Reflektionen wiedergegeben werden, oder ob die Matrix die Reflexionen schon auf ihren Weg schickt, noch bevor die direkte Welle erzeugt wird. Im Ergebnis wird dann ein Raum dargestellt, der kleiner ist als der Ausgangsraum.
Das ist nicht nur interessant, um zum Beispiel Stimmen aus dem Innenraum eines PKW ins Wohnzimmer zu quetschen. Ganz neue Perspektiven tun sich damit in der Beschallungstechnik auf.
In einen zu großen Saal, bei dem lange Schallwege der ersten Reflexionen ein psychoakustisch ungünstiges Schallfeld erzeugen, kann ein kleinerer, akustisch günstiger virtueller Raum „hineinkonstruiert" werden. Alles andere genau nach dem beschriebenen Verfahren. Allerdings muß die Publikumsfläche immer noch in diesen kleineren virtuellen Saal hineinpassen, außerhalb seiner Grenzen kommt es zu akustischen Konfusionen.
Nichts spricht dagegen, dass der Aufnahmeraum auch gleichzeitig der Wiedergaberaum ist. Nur an die Signalverarbeitung des Systems müssen dann höhere Anforderungen gestellt werden, sie müßte annähernd in Echtzeit arbeiten. Wenn ein Redner in ein Mikrofon spricht, lassen ihn zu hohe Verzögerungszeiten sonst ins Stottern kommen.
Vorzug eines solchen Systems ist es, das sich der Schall von der großflächigen Matrix sehr gezielt ausrichten läßt. Die direkte Welle kann bei geeigneter Matrixanordnung gezielt schräg von oben auf das Publikum gerichtet werden, dort würde sie zum überwiegenden Teil absorbiert. Auch die ersten schallstarken Reflexionen lassen sich über glatte Begrenzungsflächen gezielt ausrichten.
Das eröffnet eine sehr interessante Anwendungsmöglichkeit: Der Schall kann nur auf einen Teilbereich der Publikumsfläche ausgerichtet werden. Zum Beispiel auf die Sitzplätze der rechten Seite, dort wo die fremdsprachigen Gäste sitzen. Links wäre die Landessprache zu hören.
Nicht ohne Übersprechen vom anderen Bereich. Dessen Lautstärke würde im wesentlichen durch den Schallabsorbtionsgrad der Publikumsfläche bestimmt. In einem Saal mittlerer Nachhallzeit wären bei dicht besetzter Publikumsfläche mit Polsterbestuhlung etwa 10 dB Pegelunterschied zu erwarten, mit schweren Polstersesseln wären ca. 15 dB realistisch. [6]
Wegen des bekannten Party-Effekts würde sich dann jeder Zuhörer auf sein Signal konzentrieren. Damit wären solche Werte ausreichend und die Zuhörer würden die leiseren fremdsprachigen Signale sicher akzeptieren, wenn sie dafür auf ihre lästigen Kopfhörer verzichten könnten.
Bei ständig wechselndem Publikum, beispielsweise in Ausstellungen und auf Messen, bringen diese Kopfhörer erhebliche hygienische Probleme. Der auf einen einzelnen Platz fokussierte Schall der beschriebenen Matrix könnte das Problem, auch mit preiswerten Einzelstrahlern, lösen. Das Schallfeld ließe sich sogar dem bewegten Zuhörer nachführen. Mit den bekannten Acrylglas-Kuppeln für diese Fokussierung ist das nicht möglich.
Bei praktisch aufgebauten Anlagen mit line-Arrays hat sich herausgestellt, daß der Einfluß von Artefakten, die durch die partielle Unterbrechung der Schallzeilen entstehen, relativ gering ist. Dort, wo eine Tür ist, kann die Zeile relativ breit unterbrochen werden, ohne das es subjektiv wahrnehmbar wird.
Gleiches wird auch für die Matrix gelten. Als einfache Anwendung scheint es deshalb sogar noch sinnvoll, das Verfahren auf die frontale Schallwand einzeln aufgestellter Lautsprecherboxen anzuwenden.
Die Reproduktion einer solchen Anordnung wird natürlich weit hinter der Natürlichkeit des Schallfeldes der Matrix zurückbleiben, aber schon mit wenigen Einzelstrahlern werden die oben beschriebenen Fehler herkömmlicher Lautsprecherboxen, zumindest im höheren Frequenzbereich, weniger deutlich sein.
Und schon der Versuch, wenigstens die stärksten Reflektionen überhaupt zu generieren, wird eine deutlich verbesserte subjektive Wahrnehmung hervorrufen. Auch wenn sie nicht in der beschriebenen Weise aufwendig generiert, sondern nur durch einige Standardsetups für feste Verzögerungszeiten erzeugt wurden. Mit solchen einfachen zusätzlichen verzögerten Signalen kann selbst eine übliche d'Appolito-Lautsprecheranordnung schon eine überraschende Räumlichkeit erzeugen.
Bezugszeichenliste

[1] LI XU, Shigeto Furkawa, John. C. Mmiddlebrooks, "Sensivity to Sound-Source-Elevation in Nontropic Auditory Cortex", The Journal of Neurophysiology Vol. 80 No. August 1998, pp. 882–894
[2] „The CARROUSO project,": http://www.emt.iis.fhg.de/projects/carrouso/
[3] T.Caulkins, E.Corteel, O. Warusfel, „Wave field synthesis interaction with the listening environment, improvements in the reproduction of virtual sources situatet inside the listening room" , Proc. of the 6^th Int. Conference Audio Effects (DAFx-03), London, UK, September 8–11, 2003
[4] Wittek, Helmut: http://www.irt.de/wittek/hauptmikrofon/wittek wfs litreview.pdf
[5] S. Spors, A. Kuntz, R. Rabenstein, „Listening room compensation for wave field synthesis", IEEE International Conference on Multimedia and Expo (ICME), Baltimore, Maryland, USA, July 2003
[6] Fasold, Sonntag, Winkler, „Bauphysikalische Entwurfslehre Bau- und Raumakustik" VEB Verlag für Bauwesen, 1987, ISBN 3-345-00140-3

Claims

Transformation des frühen Schallfeldes nach dem Huygens'schen Prinzip der Wellenfeldsynthese, dadurch gekennzeichnet, das virtuelle Schallquellen, auch außerhalb des für die Zuhörerposition akustisch darstellbaren Bereiches innerhalb der Grenzen der Schallwandleranordnung, durch Verknüpfung der Daten von realem oder virtuellen Aufnahmeraum und dem Wiedergaberaum an Positionen generiert werden, von denen sie nach Reflexion an den Begrenzungsflächen des Wiedergaberaumes für den Zuhörer in der Entfernung und nahe der Position der Spiegelschallquellen, die eine zugehörige Schallquelle an den Begrenzungsflächen des Aufnahmeraumes erzeugt oder erzeugen würde, wahrgenommen werden, wodurch ein Schallfeld erzeugt wird, das scheinbar die Dimension des Schallfeldes des Aufnahmeraumes hat.
Transformation des frühen Schallfeldes nach dem Huygens'schen Prinzip der Wellenfeldsynthese nach Patentanspruch 1, dadurch gekennzeichnet, das die Amplituden der beschriebenen virtuellen Schallquellen in den einzelnen Oktaven so korrigiert werden, das die Differenz der Reflexions-Faktoren der betreffenden Begrenzungsflächen von Aufnahme- und Wiedergaberaum durch entsprechende Korrektur des Pegels der virtuellen Schallquelle ausgeglichen wird.
Transformation des frühen Schallfeldes nach dem Huygens'schen Prinzip der Wellenfeldsynthese nach Patentanspruch 1, dadurch gekennzeichnet, das die räumliche Richtcharakteristik einer Schallquelle durch Amplitudenkorrekturen ihrer virtuellen Spiegelschallquellen bei der Wiedergabeseitigen Schallfeldsynthese reproduziert wird.
Transformation des frühen Schallfeldes nach dem Huygens'schen Prinzip der Wellenfeldsynthese nach Patentanspruch 1, dadurch gekennzeichnet, das durch die Raumpositionen der virtuellen Schallquellen Wellenfronten erzeugt werden, die gegenüber der direkten Welle vorzeitig in Richtung der Begrenzungsflächen des Wiedergaberaumes abgestrahlt werden, um seine akustisch wahrgenommene Dimension virtuell zu verkleinern.
Transformation des frühen Schallfeldes nach dem Huygens'schen Prinzip der Wellenfeldsynthese nach Patentanspruch 1, dadurch gekennzeichnet, das in einem gemeinsamen Wiedergaberaum diskrete kleinere virtuelle Wiedergaberäume erzeugt werden, in denen unterschiedliche Signale erzeugt werden.
Transformation des frühen Schallfeldes nach dem Huygens'schen Prinzip der Wellenfeldsynthese nach Patentanspruch 1, dadurch gekennzeichnet, das das Wiedergabe-Schallfeld auf einen kleinen Raumteil reduziert wird, dem es über Veränderung der Parameter der Zuhörerposition nachgeführt werden kann.
Transformation des frühen Schallfeldes nach dem Huygens'schen Prinzip der Wellenfeldsynthese nach Patentanspruch 1, dadurch gekennzeichnet, das die Daten zur momentanen Position und Ausrichtung der Schallquellen im Aufnahmeraum zusammen mit den Parametern dieses Raumes für aufgezeichnete Schallereignisse vor der Audioübertragung übermittelt und bei der Wiedergabe in einer time- line mit den Audiodaten zusammengeführt werden können.