-
Teil a) Problembeschreibung
-
Die
Audiowiedergabe mit Lautsprechern wurde in den letzten Jahrzehnten
deutlich verbessert. Computergestützte Entwicklung und Fertigung sichern
nun selbst im Konsumerbereich ausgezeichnete technische Parameter.
Und dennoch: Auch die besten Anlagen versagen bis heute kläglich, verglichen
mit dem Originalschallfeld.
-
Die
Ursache hierfür
kann nicht mehr in den Unzulänglichkeiten
der Wandler selbst begründet sein.
Offensichtlich gibt es Fehler im Übertragungssystem, die wir
bei der Reproduktion des Schallfeldes nicht korrigieren.
-
Genau
wie im Originalschallfeld erreicht uns von den Lautsprechern zuerst
die direkte Welle. Über die
Laufzeitunterschiede zu unseren Ohren können wir im Bereich von ca.
160 bis 3600 Hertz sofort sehr präzise die horizontale Richtung
der Schallquelle bestimmen.
-
Dabei
ist wichtig, dass diese Wahrnehmung nicht zu früh durch Reflektionen gestört wird.
Wenn diese früher
als 2 ms nach dem Primärschall
eintreffen, verhindern sie nicht nur die präzise Ortung, sondern verwischen
auch die Einschwingvorgänge
und verändern
dadurch den Klangeindruck völlig.
-
Das
geschieht bei herkömmlichen
Lautsprechern vor allem dann, wenn sie dicht an den Wänden des
Wiedergaberaumes aufgestellt werden. Jenseits dieser Wände erzeugen
sie kräftige
Spiegelschallquellen, weil sie im Grundtonbereich relativ ungerichtet
abstrahlen. Deren Wellenfronten überlagern
sich mit der direkten Welle. Deshalb klingt ein und derselbe Lautsprecher
in einem Raum gut, im anderen schlecht, je nachdem wie seine frequenzabhängige Richtcharakteristik
mit der Raumakustik harmoniert.
-
Alle
Versuche, die entstehenden Kammfiltereffekte im Frequenzgang dann
wieder auszugleichen, bringen neue Probleme. Die Impulsantwort wird
oft noch indifferenter und verhindert nun eine exakte Ortung der
Punktschallquelle völlig.
Zur Veranschaulichung ist in 1 dargestellt,
welche Reflektionen den Zuhörer
bei einer solchen Anordnung treffen, wenn eigentlich nur eine einzige
Wellenfront dargestellt werden soll.
-
Wenn
aber die ersten schallstarken Reflektionen im Zeitfenster zwischen
ca. 5 und 50 Millisekunden nach der direkten Welle eintreffen, verfälschen sie
den Klangeindruck nicht mehr. Im Gegenteil, sie werden noch direkt
dem Primärschall
zugeordnet und erhöhen
so die subjektiv empfundene Lautstärke. Falls sie dazu aus deutlich
anderer Richtung als der Primärschall
eintreffen, sorgen sie für
das durchsichtige, offene und räumliche
Klangbild, wie wir es von realen Schallquellen kennen. Herkömmliche Lautsprecher
können
das nicht reproduzieren, weil sie diese Richtungsdifferenz nicht
darstellen können.
-
Dabei
ist gerade das der eigentliche Kern jeder Raumakustik, nicht nur
in der horizontalen Ebene des Zuhörers, auf die alle herkömmlichen
Lautsprecher-Wiedergabe-Verfahren
reduziert sind. Unabdingbare Voraussetzung für eine wirklich authentische
Reproduktion des Raumeindrucks ist es, dass die ersten schallstarken
Reflektionen in allen Ebenen zeit- und richtungs- bezogen wiederhergestellt
werden.
-
Die
Elevation einer Schallquelle können
wir vor allem über
Reflektionen an unseren Ohrmuscheln und am Rumpf bestimmen. Diese
frequenzabhängigen
Ortungen sind nicht so exakt, wie die Laufzeitortung. Zudem sind
sie individuell sehr verschieden, weil die Zuordnungen vor allem über optische Verknüpfungen
erlernt werden.
-
Im
Obertonbereich müssen
wir uns auch in der horizontalen Ebene auf diese Hörerfahrung
verlassen, weil mehrere Wellenlängen
innerhalb des Ohrabstandes liegen und die Laufzeitortung deshalb nicht
mehr eindeutig ist. Deshalb orten wir auch hier die Schallquellen
amplitudenbezogen. Wir haben gelernt, Beugungs- und Abschattungseffekte
am Kopf mit einer Richtungs-zuordnung zu verbinden. Dabei werten
wir den Frequenzbereich über
ca. 8 kHz nicht mehr aus.
-
Wie
wichtig die zeitrichtige Staffelung der ersten schallstarken Reflektionen
aber unterhalb dieser Frequenz ist, kann man in vielen Konzerthallen der
Welt nachvollziehen. Treffen die ersten schallstarken Reflektionen
nämlich
zu spät,
also mehr als ca. 60 ms nach dem Primärschall, beim Zuhörer ein, wird
Sprache schwer verständlich
und Musik indifferent und verwischt.
-
Nach
ca. 100 ms ist die Richtung der Schallwellen nicht mehr von Bedeutung.
Wir ordnen sie dann dem Nachhall zu, der zwar wichtige Infor-mationen
zur Beschaffenheit des Raumes liefert, dessen räumliche Ortung aber eine untergeordnete
Rolle spielt.
-
Deshalb
ist es wenig sinnvoll, die Raumdarstellung zu sehr auf die Reproduktion
des Nachhalls zu beschränken.
Die Darstellung bleibt unglaubwürdig, solange
die Lautsprecher der Audiowiedergabe die ersten schallstarken Reflektionen
des Wiedergaberaumes aufprägen.
-
Aus
der aufgezeigten Problematik wird deutlich, dass zur natürlichen
Reproduktion eines primären
Schallfeldes Anforderungen gestellt werden müssen, die herkömmliche
Lautsprecherwiedergabe nicht befriedigend erfüllen kann:
Die räumliche
Staffelung des Schallfeldes bleibt völlig dem Zusammenspiel von
Lautsprecher und Abhörraum überlassen.
Wegen ihrer weitgehend ungerichteten Abstrahlung im Grundtonbereich
können
herkömmliche
Lautsprecheranordnungen nicht gewährleisten, dass der Direktschallanteil
gegenüber
verfrüht
eintreffenden Reflektionen des realen Wiedergaberaumes ausreichend
groß ist.
-
Deshalb
reproduzieren sie nicht die akustischen Verhältnisse am Aufnahme-Ort, sondern prägen dem
Schallereignis die Akustik des Wiedergaberaumes auf, was zwangsläufig zu
völlig
verfälschten
Ergebnissen führen
muss. Das Einschwingverhalten des Aufnahmeraumes, also die zeit-
und richtungsbezogene Reproduktion seiner ersten schallstarken Reflexionen,
können
sie überhaupt
nicht darstellen.
-
Solch
eine gezielte Staffelung der Abstrahlung kann nur eine Lautsprecheranordnung
bewirken, deren Ausdehnung sich mindestens über zwei Wellenlängen der
abgestrahlten Frequenz erstreckt. Sie muss die Wellenfronten in
der horizontalen und in der vertikalen Ebene gesteuert ausrichten
können. Die
exakte Reproduktion ist vor allem im Gesichtsfeld wichtig, weil
wir Fehler hier am schnellsten wahrnehmen. [1]
-
Herkömmliche
Lautsprecherboxen sind für eine
authentische Reproduktion also schon deshalb ungeeignet, weil sie
zu klein sind, um eine gezielte Richtcharakteristik im Grundtonbereich
zu ermöglichen.
Mit kohärent
angesteuerten Lautsprechern kann eine solche Richtwirkung nur mit
langen Schallzeilen erreicht werden, dann aber auch nur in ihrer Längsachse
und nicht steuerbar. Weitaus bessere Möglichkeiten bietet das Verfahren
der Wellenfeldsynthese, zu dem es gerade in den letzten Jahren weltweit
intensive Forschungsarbeit gibt [2]. Die Einzelstrahler einer Lautsprechergruppe
werden dabei durch eine Computersynthese einzeln und differenziert
so angesteuert, dass sie gemäß dem Huygens'schen Prinzip wieder
einen Ausschnitt einer primären
Wellenfront generieren. Ihre Membranen werden dazu exakt zu dem
Zeitpunkt ausgelenkt, zu dem auch die Wellenfront der realen Schallquelle
ihren Raumpunkt durchlaufen würde.
-
Im
Unterschied zu Einzellautsprechern, die nur instabile Phantomschallquellen
generieren können,
werden so virtuelle Schallquellen erzeugt, die sich in ihrer stabilen
Ortbarkeit für
den Zuhörer
nicht von der Wellenfront des primären Schallfeldes unterscheiden.
-
Mit
dem Verfahren können
konvexe und konkave Wellenfronten generiert werden, so dass die Beschränkung herkömmlicher
Wiedergabe, nach der die dichteste Schallquelle die Entfernung zum
Lautsprecher haben kann, aufgehoben ist.
-
Auch
parallele Wellenfronten können
erzeugt werden, indem der Ausgangspunkt der virtuellen Quelle unendlich
weit hinter die Lautsprecherfront verschoben wird, ohne die Amplitude
entsprechend abzusenken.
-
Der
Aufwand für
diese Synthese ist groß, weil
die Lautsprecher wegen sonst auftretender Aliasing-Effekte mit Frequenzgangverfälschungen
an einzelnen Zuhörerplätzen nicht
in zu großem
Abstand voneinander montiert sein dürfen. Eine Schallquelle kann
auch nur dargestellt werden, wenn sie sich vom Zuhörer aus
gesehen innerhalb des Lautsprecherfeldes befindet. Wegen dieses
truncation-Effektes werden die Lautsprecher Kreis- oder Rechteckförmig um
den Zuhörer
aufgestellt, um Schallquellen aus allen Richtungen darstellen zu können. [3]
Deshalb ist es heute üblich,
das Verfahren auf horizontale Strahlerzeilen zu reduzieren, was aber
signifikante Einschränkungen
nach sich zieht:
Die Reproduktion der Elevation von Schallquellen
ist nicht mehr möglich.
In der vertikalen Ebene haben die horizontalen Zeilen das gleiche
ungerichtete Abstrahlverhalten wie einzelne Boxen. Bei einem Vergleich
der Ausbreitung der Schallwelle einer realen Quelle mit der Wiedergabe
einer solchen WFS-Zeile, wie in (2)
dargestellt, wird deutlich, das die Kugelwellen der Einzelstrahler
der Schallzeile zwar in der horizontalen Ebene die Wellenfront sehr
exakt nachbilden, das aber in der vertikalen Ebene sehr starke Abweichungen
entstehen.
-
Über die
Decken-Reflektion des Wohnraumes treffen diese Wellenfronten in
unserem Wohnraumbeispiel schon 3,34 Millisekunden nach der direkten
Welle beim Zuhörer
ein. Dagegen kommt diese Reflektion in dem akustisch günstigen
Aufnahmeraum unseres Beispiels erst 22,7 ms nach ihr an, also in
dem psychoakustisch günstigen
Zeitfenster.
-
Genau
wie konventionelle Lautsprecher hat die WFS-Zeile also in der Elevationsebene
dem Schallereignis die ungünstige
Akustik des Wiedergaberaumes aufgeprägt. Die tatsächliche
Wellenfront des Aufnahmeraumes wird in dieser Ebene überhaupt
nicht, oder nur mit einem Signal aus Richtung der Schallquelle,
dargestellt. Der offene Schalleindruck des Aufnahmeraumes geht völlig verloren.
-
Zudem
können
von einer solchen Schallzeile nicht wirklich parallele Wellenfronten
generiert werden. Es entstehen immer Zylinderwellen, deren Schalldruck
mit Verdopplung der Entfernung um 3 dB abnimmt. Im Umkehrschluss
ergibt sich daraus, dass der Pegel der Schallzeile deutlich zunimmt,
wenn sich der Zuhörer
dicht annähert,
was zwangsläufig zur
Einschränkung
des sweetspots führen
muss.
-
Der
Schalldruck einer zweidimensional generierten parallelen Welle bleibt
dagegen völlig
konstant, egal ob der Zuhörer
10 Meter entfernt steht, oder unmittelbar vor der Strahlerfläche.
-
Praktisch
aufgebaut wurde solch eine WFS-Strahlerfläche bereits 1997 an der Universität Tokyo.
[4] Damit wurde ein Traum verwirklicht, den Experten schon in den
dreißiger
Jahren hatten, den sie damals aber für niemals realisierbar hielten – die Anordnung
verwirklicht das Prinzip des akustischen Vorhangs (acustic curtain).
-
Die
Lautsprechermembranen reproduzieren dabei den Schalldruck einer
gleich angeordneten Fläche
im Aufnahmeraum, so als ob auf einer Seite einer Wand Mikrofone
angeordnet wären,
die jeweils den zugehörigen
Lautsprecher auf der anderen Seite der Wand ansteuern. Innerhalb
dieses Fensters ist die Wiedergabe perfekt. Jedoch gilt auch hier
die Einschränkung,
dass die wiedergegebene virtuelle Schallquelle vom Zuhörer aus
gesehen innerhalb der Lautsprecheranordnung plaziert sein muss.
-
Trotzdem
kann nicht der akustische Eindruck des Aufnahmeraumes erzeugt werden.
Die Beschränkung
auf den Ausschnitt vermittelt eher den Eindruck, das man durch ein
offenes Fenster in das Opernhaus hineinhören könne, weshalb man aber doch
nicht die akustische Wahrnehmung verliert, das man immer noch freien
steht.
-
Sicher
ließe
sich die Anordnung, wie die WFS-Lautsprecherzeilen, über alle
wände des
Wiedergaberaumes ausdehnen. Das brächte aber zwei neue Probleme:
Die
fensterlosen, unmöblierten
Räume wären nicht besonders
wohnlich, was die Akzeptanz für
ein solches System drastisch senken würde. Zudem würden die
gleichen Probleme entstehen, die schon bei den WFS- Zeilen relativ
erfolglos bekämpft
werden:
Die generierten Schallwellen werden von der jeweils gegenüberliegenden
Wand reflektiert und schaffen damit wieder das Problem der viel
zu frühen
schallstarken Reflexionen. Bei den WFS- Schallzeilenanordnungen
wird der Effekt durch sehr starke Bedämpfung der Wiedergabe-Räume gemildert,
was wiederum der Wohnlichkeit nicht unbedingt förderlich ist. Versuche zur
elektronischen Kompensation brachten nur wenig Erfolg. [5]
-
Die übliche Betrachtung
eines Übertragungssystems
beginnt beim Mikrofon und endet beim Lautsprecher. Die Akustik des
Abhörraumes und
die Position des Zuhörers
haben höchstens
noch Einfluss auf den eingestellten Gesamtfrequenzgang.
-
Dabei
hat der Wiedergaberaum den maßgeblichsten
Einfluss auf die Qualität
der Gesamtwiedergabe. Der größte Anteil
der Signalverfälschungen in
der gesamten Übertragungskette
entsteht, nachdem die Lautsprecher ihre Arbeit getan haben.
-
Weil
aber die akustischen Parameter dieses Übertragungsgliedes bei keinem
bekannten Wiedergabesystem differenziert in die Übertragungskette einbezogen
werden, gibt es auch keine Möglichkeit, seine
Fehler gezielt zu korrigieren.
-
Teil b) Problemlösung
-
Es
ist deutlich geworden, dass das Prinzip der Wellenfeldsynthese der
einzige Ausgangspunkt bei dem Versuch sein kann, das Schallfeld
eines Aufnahmeraumes in einen völlig
anderen Wiedergaberaum zu transformieren. Das Prinzip darf aber nicht
auf eine einzelne Schallzeile reduziert werden, wenn wir ein dreidimensionales
Schallfeld erzeugen wollen.
-
Deshalb
müssen
wir eine zweidimensionale Lautsprechermatrix aufbauen, die frontal
vor dem Zuhörer,
möglicherweise
versteckt hinter einer Projektionswand, aufgestellt wird. Ihre Ausdehnung
sollte aber deutlich über
die Fläche
einer solchen Bildwand hinausgehen.
-
Ihre
Einzelstrahler sollten in einem Frequenzbereich von etwa 160 Hertz
bis ca. 8 kHz linear arbeiten und möglichst einen Membrandurchmesser unter
2 Zoll haben, um im gesamten Arbeitsbereich eine homogene Halbkugelwelle
erzeugen zu können. Über 8 kHz übernehmen
zwei hochwertige Hochtonlautsprecher links und rechts, weil die
räumliche
Ortung in diesem Bereich untergeordnet ist. Ein Subwoofer ergänzt im Bassbereich.
-
Der
Abstand der Matrixlautsprecher zueinander bestimmt die Aliasing-Frequenz. Er sollte
nicht unter 20 cm liegen, 10 cm wären besser, was aber den vierfachen
Aufwand bedeutet.
-
Auch
bei ca. 20 cm Abstand ist ihre Zahl in üblichen Räumen schon deutlich dreistellig,
so dass die Einzelstrahler nur noch wenig zur Gesamtschalleistung
beitragen müssen.
Wenige Watt Leistung sind deshalb für die Einzelendstufen, die
jedem Lautsprecher zugeordnet sein müssen, völlig ausreichend. Sie können mit
einer gemeinsamen Betriebsspannung versorgt werden, auch die digitale
Ansteuerung kann über
eine gemeinsame Busleitung erfolgen. Handelsübliche Schaltkreise können heute
als De-Multiplexer bis zu 192 Kanäle aus einem gewöhnlichen
KAT5-Kabel aus einem solchen Bus ausfiltern und sie sind dabei recht
preiswert.
-
Der
Ansteuerbus kommt, wie bei den linearen WFS-Systemen, vom WFS-Renderer, einer leistungsfähigen Signalprozessoranordnung,
die aus Inhalt und Form, also den bis dahin getrennt verarbeiteten
Daten von reinem Audiosignal und den Positionen der zugehörigen virtuellen
Schallquellen, die einzelnen Ansteuersignale für die Lautsprecher erzeugt.
-
Damit
ist die Hardware festgelegt, mit der wir das transformierte Schallfeld
auf der Wiedergabeseite erzeugen wollen. Auf den ersten Blick scheint
dieser Versuch aussichtslos, vor allem deshalb, weil die Lautsprechermatrix
auf eine einzige Wand dieses Raumes beschränkt sein soll.
-
Der „truncation" – Effekt, also die Einschränkung der
Abstrahlung auf den Bereich innerhalb der Lautsprecheranordnung,
würde bei
einer solchen Anordnung eine Lösung
unmöglich
machen, solange wir sie als Wiedergabesystem einzeln betrachten. Sehen
wir aber den Wiedergaberaum nicht mehr als störenden Faktor, den wir mit
möglichst
dicken schwarzen Tüchern
oder leeren Eierkartons ausschalten wollen, ergeben sich völlig neue
Möglichkeiten:
Der
truncation-Effekt ist immer auf die Position des Zuhörers bezogen.
Geht der beispielsweise zur rechten Wand, vorn neben der Matrix,
kann er einen ganz anderen Bereich, bis weit links neben der Matrix
hören.
-
Eine
dort positionierte Schallquelle trifft natürlich auch rechte Seitenwand
und wird von der reflektiert. Schon bei im Heimbereich problemlos
realisierbaren, Diagonalen von 3 bis 4 Metern ist die Richtwirkung
der Matrix auch im Grundtonbereich so hoch, dass – dem truncation-Effekt
sei Dank – der
Zuhörer
nicht direkt von der Wellenfront getroffen wird.
-
Das
funktioniert natürlich
genauso mit der linken Wand, der Decke und dem Fußboden.
-
Aus
den Spiegelschallquellen der Lautsprecher im Wiedergaberaum, die
uns bisher so gestört haben,
sind in dieser Betrachtung völlig
unabhängig ansteuerbare
Schallquellen geworden, die uns ganz neue Möglichkeiten für die Gestaltung
des Schallfeldes bieten.
-
Um
sie zu nutzen, müssen
ihre Eigenschaften bekannt sein. Nach der Installation der frontalen Lautsprecherwand
müssen
deshalb alle relevanten Parameter des Wiedergaberaumes in das System eingegeben
werden.
-
Für die spätere Schallfeldsynthese
werden neben den geometrischen Daten des Wiedergaberaumes auch die
Reflektionsfaktoren der Wände, getrennt
angegeben für
jede Oktave des Wiedergabebereiches, erfasst. In der Praxis wird
das recht einfach sein, das Anklicken des jeweiligen Materials in einem
entsprechenden Computerprogramm genügt. Die Möglichkeit, statt dieses datenbasierten
Modells die Impulsantwort der Räume
zu verarbeiten, ist hier weniger geeignet.
-
Auch
die Position des Zuhörers
muss festgelegt werden. Wir brauchen für eine Transformation unbedingt
einen festen Bezugspunkt. Erst an den Ohren des Zuhörers auf
diesem Platz darf unsere Systembetrachtung enden. Hier müssen wir
die gleichen Verhältnisse
schaffen, wie an einem, ebenfalls festzulegenden Punkt, an dem sich
unser Zuhörer
im Aufnahmeraum befindet.
-
Dieser
festgelegte Widergabeplatz soll nicht die einzige stelle im Raum
werden, auf dem eine hochwertige Reproduktion möglich ist. Er muss vielmehr
der Mittelpunkt eines möglichst
großen sweet-spot's für die Wiedergabe
sein.
-
Von
der Aufnahmeseite benötigen
wir für
die Transformation der ersten schallstarken Reflektionen die Audiosignale
der einzelnen Schallquellen. Für jede
Schallquelle ist ein separater Kanal erforderlich, wobei Einzelquellen
zusammengefasst werden können,
wenn sie räumlich
eng benachbart sind. In die Transformation müssen auch ihre momentane Position,
ihre polare Richtcharakteristik und ihre momentane Ausrichtung eingehen.
Die polare Richtcharakteristik kann den statischen Daten zugeordnet
werden, weil sie sich während
des Zeitraumes der Übertragung
nicht ändert.
Diese Daten werden vor dem Beginn der eigentlichen Audioübertragung übermittelt.
-
Sie
müssen
nicht jedes Mal neu übertragen werden,
wenn sie auf der Wiedergabeseite bekannt sind. Richtcharakteristiken
aller erdenklichen Schallquellen zum Beispiel, könnten in Bibliotheken auf der Wiedergabeseite
abgelegt sein und durch entsprechende Codes der jeweiligen Schallquelle
zugeordnet werden.
-
Die
momentane Position und die momentane Ausrichtung der Schallquelle
müssen
den dynamischen Daten zugeordnet werden, die während der Übertragung in kurzen Zeitabständen aktualisiert werden.
Schließlich
macht es für
den Zuhörer
einen deutlich anderen Schalleindruck, wenn Carruso sich unerwartet
umdreht und seine Arie gegen die Kulissen schmettert.
-
Wie
auf der Wiedergabeseite muß für die Transformation
auch eine Position und Ausrichtung des Zuhörers im Aufnahmeraum festgelegt
werden. Das kann der akustisch günstigste
Platz sein. Zusammen mit einer Bildübertragung ist es aber sinnvoller,
wenn deren Position und Ausrichtung mit der Bildübertragung korrespondiert.
-
Mit Änderung
dieser Koordinaten ändert
sich Abstand, Einfallswinkel und Pegel aller Wellenfronten bei diesem
Zuhörer
sowohl für
die direkten Wellen von den einzelnen Schallquellen als auch für alle von den
Spiegelschallquellen des Raumes ausgehenden Schallwellen. Wenn es
gelingt, diese Änderungen
auf den Zuhörer
im Wiedergaberaum zu übertragen, könnte mit
der Veränderung
eines einzigen Datenblocks seine akustische Perspektive auf jeden
beliebigen Punkt im Aufnahmeraum verschoben werden. Und wenn er
wollte, könnte
er das mit seiner Fernbedienung auch selbst tun.
-
Die
Positionen der Spiegelschallquellen, die ein Schallereignis im Aufnahmeraum
durch die Reflektionen an seinen Begrenzungsflächen erzeugt, spielt eine Schlüsselrolle
bei der Transformation des Schallfeldes. Gelingt es, bei der wiedergabeseitigen Synthese
virtuelle Schallquellen scheinbar von diesen Positionen ausgehen
zu lassen, so erzeugen sie an der Zuhörerposition im Wiedergaberaum
die gleiche Impulsantwort, die auf den Zuhörer im Aufnahmeraum einwirkt.
-
Weil
auch die direkte Welle mit dem akustischen Vorhang ziemlich perfekt
nachgebildet werden kann, entsteht so ein völlig realistisches Abbild des Schallfeldes,
soweit auch Amplituden und Einfallswinkel dieser Wellenfronten übereinstimmen.
-
Nur
mit der frontalen Lautsprechermatrix können wir diese Spiegelschallquellen
allerdings nicht an allen Raumpositionen generieren. Mit den unabhängig steuerbaren
Spiegelschallquellen der Matrix gelingt es aber, ein sehr ähnliches
Schallfeld zu erzeugen.
-
In 3 stellt
der äußere Quader
wieder unseren Aufnahmeraum dar. Der kleinere Wiedergaberaum wurde
zur Erläuterung
so in diesen Saal eingezeichnet, dass die für unsere Übertragung festgelegten Positionen
der Zuhörer
im Saal und zu Hause übereinstimmen.
An dieser Position wollen wir übereinstimmende
Signale erzeugen.
-
Der
Ausgangspunkt der direkten Welle liegt im Bereich des akustischen
Vorhangs, sie wird deshalb exakt dargestellt. Jedoch liegt die Position
der Spiegelung der primären
Schallquelle im Aufnahmeraum außerhalb
des darstellbaren Bereiches, weit entfernt vom Bereich der Lautsprechermatrix,
aber doch nicht allzu weit vom Bereich unserer unabhängig ansteuerbaren
Spiegelschallquelle.
-
Also
müssen
wir sie in einem ersten Schritt in diesen Bereich verschieben, um
sie so gut wie möglich
darstellen zu können.
Das geschieht auf einer Kreisbahn um unseren festgelegten Zuhörerpunkt. Diese
Verschiebung muß aber
ausreichend weit in diesen Bereich hinein erfolgen, weil sich der
Zuhörer sonst
im Randbereich des jeweiligen sweet-spots befände.
-
Wichtig
ist vor allem, dass die Entfernung zum Zuhörer und damit die Zeit unverändert geblieben
ist, zu der die Welle beim Zuhörer
eintrifft.
-
Weil
im Bereich über
der Wohnzimmerdecke keine realen Lautsprecher existieren, müssen wir
die festgelegte Position nun im zweiten Schritt an der Zimmerdecke
spiegeln. In 4 ist das dargestellt. Da dem
System die Dimensionen des Wiedergaberaumes bekannt sind, lässt sich
die endgültige
Position unserer virtuellen Schallquelle nach den einfachen Regeln
der Geometrie berechnen.
-
Damit
hat der WFS-Renderer alle Informationen, die er braucht um die Einzellautsprecher
anzusteuern. Er muß das
zur Spiegelschallquelle zugehörige
Audiosignal nur noch um die berechnete Schall-Laufzeit von ihrem
Ausgangspunkt bis zum jeweiligen Lautsprecher verzögern.
-
Natürlich wird
ein Teil dieser Wellenfront von der Zimmerdecke in Wärme umgewandelt,
weshalb sie nie beim Zuhörer
ankommt. Das passiert aber im Aufnahmeraum auch. Sind die Reflektionsfaktoren
in beiden Räumen
gleich, muss die Amplitude unserer virtuellen Spiegelquelle nur
mit der Übertragungsfunktion
der entsprechenden Wand des Aufnahmeraumes korrigiert werden.
-
Sind
die Materialien beider Decken unterschiedlich, kann ihr Frequenzgang
leicht in den einzelnen Oktaven um die Differenz der Reflektionsfaktoren
korrigiert werden. Hat beispielsweise unser Aufnahmeraum bei einer
bestimmten Frequenz einen Reflektionsfaktor von 0,9, unsere Wohnzimmerdecke
aber nur 0,7, so muß der
Pegel unserer virtuellen Spiegelschallquelle um 20 log (0,9/0,7),
also um 2,2 dB, angehoben werden. Zusätzlich wird dieser Pegel nach
den Gesetzen der Kugelwellenausbreitung und um den Betrag der Luftschalldämmung für ihren
virtuellen Teil der Weglänge
bis zum jeweiligen Lautsprecher reduziert.
-
Die
polare Richtcharakteristik der zugehörigen Schallquelle geht in
die Synthese ein, indem die Amplitude der virtuellen Spiegelschallquelle
frequenzabhängig
um den Betrag der Pegelabsenkung in ihrem polaren Richtdiagramm
im zugehörigen Raumwinkel
reduziert wird.
-
Nach
dem gleichen Prinzip wandern dann die Ausgangspunkte der virtuellen
Quellen für
die Boden-Reflexion von unten nach oben und die für die Seitenwände von
links nach rechts und umgekehrt.
-
Die
Reflexion der Vorderwand kann direkt innerhalb der Matrix erzeugt
werden, während
die Darstellung der Reflexion der Rückwand ohne hintere Lautsprecher
schwieriger darzustellen ist. Für
diese wird die Wellenfront, wie in 4 dargestellt,
doppelt gespiegelt. Erst an der Decke und dann an der Rückwand.
Wegen des „truncation"-Effektes trifft
sie dabei den Zuhörer
auf ihrem Hinweg kaum. Die Reflexionsfaktoren der Rückwände werden
wieder verrechnet, die Absorption der Wiedergaberaum-Decke wird durch
entsprechende frequenzabhängige
Pegelanhebung ausgeglichen.
-
Soweit
möglich,
sollte die Rückwand
des Wiedergaberaumes im oberen Bereich schallhart sein. Darunter
könnte
ein Sofa, ein offenes Bücherregal
oder ein Wandteppich die direkte Welle absorbieren.
-
Verläßt unser
Zuhörer
zu Hause seinen Bezugspunkt, so ändert
sich sein Abstand zur virtuellen Schallquelle und zu all ihren Spiegelschallquellen. Die
Laufzeiten zu ihnen und damit die Impulsantwort an seiner aktuellen
Raumposition verändern
sich in der gleichen Weise, wie sie sich im Aufnahmeraum für unseren
virtuellen Zuhörer
verändern
würde, wenn
er seinen Platz verläßt. Setzt
er sich zu Hause also einen Platz nach rechts, so hat er den gleichen Schalleindruck
wie der rechte Nachbar unseres virtuellen Zuhörers im Aufnahmeraum. Die Größenverhältnisse
dieser Ortsveränderung
sind nicht transformiert worden, also kann unser Zuhörer im Schallfeld nicht
mehr als fünf
Plätze
nach rechts gehen, weil er dann gegen eine Wand läuft.
-
Und
noch zwei Einschränkung
hat er: Er darf in den Bereichen, in denen Wellenfronten der Spiegelschallquellen
auf dem Weg zu den Zimmerwänden
sind, also unmittelbar rechts oder links neben der Lautsprechermatrix,
nicht mit einer hochwertigen Wiedergabe rechnen. Hier erreichen
ihn Wellenfronten zur falschen Zeit aus falschen Richtungen, so
wie wir es von herkömmlicher
Lautsprecherwiedergabe gewöhnt
sind.
-
Und
er kann die direkte Schallquelle nicht hören, wenn er den truncation-Bereich des akustischen Vorhanges
verläßt. Diese
Einschränkung
ist bedeutsamer, weil sie den sweet-spot für die Wiedergabe seitlich einschränkt, wenn
sich eine virtuelle Quelle dicht neben ihrem Rand befindet.
-
Soll
trotzdem eine Schallquelle weit seitlich dargestellt werden, so
können
wir uns als Kompromißlösung wieder
unserer unabhängig
steuerbaren, virtuellen Spiegelschallquellen der Matrix bedienen: So
kann zum Beispiel sehr weit rechts eine virtuelle Schallquelle positioniert
werden, indem nach dem beschriebenen Verfahren ihr Ausgangspunkt
an der rechten Wand nach links gespiegelt wird.
-
Die
Amplitudenverfälschung
durch die Wandreflexion wird mit der inversen Übertragungsfunktion dieser
Wand kompensiert. Jedoch kann die rechte Seitenwand-Reflexion dieser
Quelle nur noch aus Richtung der Quelle selbst generiert werden. Aber
im korrekten Abstand, so das der Fehler nur dem geübten Hörer auffallen
wird.
-
Weiterer
Nachteil dieser Methode ist es, dass der relative Winkel der Schallwellen
zur Achse der Matrix größer ist.
Damit verschiebt sich die Aliasing-Frequenz bei gegebenem Einzelstrahlerabstand
nach unten. Eine Signalverfälschung,
die allerdings bei einer zweidimensionalen Matrix geringer ist als
bei den Line-Arrays: Werden die Einzelstrahler nämlich nicht im Raster, sondern
wabenförmig
angeordnet, erhöhen
die benachbarten Strahler die horizontale Aliasing- Frequenz um
den Faktor 1,4.
-
Je
nach vertikaler Ausrichtung der Wellenfront sind sie im Winkel der
Nullstelle nicht in Phase, wenn eine Wellenfront die Matrix seitlich
durchläuft. Dadurch
sinkt die Amplitude in diesem Winkel zwar deutlich, aber geht nicht
bis auf Null zurück.
Der Aliasing- Effekt erzeugt am Zuhörerplatz einen Kammfiltereffekt
im Frequenzgang, für
den unser Ohr nur wenig empfindlich ist, solange es keine ausgesprochenen
Nullstellen gibt.
-
Im
Wiedergaberaum hat das beschriebene Verfahren ein Schallfeld geschaffen,
dessen Impulsantwort im wichtigen Zeitabschnitt bis zu etwa 100
ms nach der direkten Welle mit der Impulsantwort des Aufnahmeraumes übereinstimmt. Lediglich
einige Einfallswinkel der Reflexionen haben sich geändert, wenn
die Dimensionen der Räume sehr
unterschiedlich sind oder wenn sich ihre Ausgangspunkte weit seitlich
vom Zuhörer
oder direkt über
ihm befinden. Innerhalb dieses, in der Psychoakustik als „cone of
confusion" bezeichneten
Bereich ist unsere Ortung aber ohnehin sehr unpräzise.
-
Der
Nachhall kann dann wieder mit dem primären Schallsignal übertragen
werden, da seine Einfallsrichtung ohne Bedeutung ist. Er erreicht
uns dann auch von den Spiegelschallquellen, was seiner unregelmäßigen Verteilung
im Aufnahmeraum sehr nahe kommt.
-
Einen
verbotenen Bereich sollte es für
alle virtuellen Schallquellen geben: Werden sie direkt in der Ebene
der Lautsprechermatrix plaziert, so muß ein einzelner Lautsprecher
fast die gesamte Schalleistung erzeugen. Deshalb müßten alle
Einzelelemente der Matrix in der Lage sein, diese Leistung verzerrungsfrei
zu erzeugen. Die Anlage würde
dann wesentlich aufwendiger. Deshalb sollten diese virtuellen Quellen
grundsätzlich
um ein oder zwei Lautsprecherabstände nach hinten verschoben
werden, damit mehrere Lautsprecher zusammenarbeiten und so auch
mit weniger leistungsfähigen
Einzelstrahlern eine gute Gesamtdynamik erzielt werden kann.
-
Im
System an sich ist nicht festgelegt, wie viele Primärsignale
gleichzeitig übertragen
werden. Schon eine einzelne Quelle, also ein Mono-Kanal kann sehr
authentisch dargestellt werden, wenn bei der Reproduktion auch alle
Zusatzinformationen von der Aufnahmeseite vorliegen. Die Eigenschaften
der Wiedergabeseite sind ohnehin im System gespeichert. Die dynamischen
Zusatzinformationen müssen
auf die jeweilige Quelle bezogen sein, die Raumdaten werden gemeinsam
genutzt.
-
Mit
den heutigen digitalen Übertragungsverfahren
ist die Übertragung
dieser Zusatzinformationen problemlos möglich. Läßt ein Übertragungssystem aber die
simultane Übermittlung
nicht zu, können sie
auch getrennt übermittelt
und gespeichert werden. Beispielsweise über das Internet.
-
Wird
eine Aufzeichnung übertragen,
so sind auch die dynamischen Zusatzdaten für die gesamte Laufzeit schon
vor Beginn der Übertragung
bekannt. Sie können
also schon vor dem Start der Wiedergabe übermittelt und abgespeichert
werden. Über
eine time-line lassen sie sich dann leicht mit der Wiedergabe verknüpfen.
-
Dann
kann also unser virtueller Carruso durch die Mailänder Scala
wandern und dabei nach belieben seinen Kopf drehen, selbst wenn
sein Originalton nur von einer alten Monoaufnahme stammt.
-
Teil c) Praktische Anwendungsmöglichkeiten
-
Mit
dem beschriebenen Verfahren gelingt, bei entsprechend produziertem
Programmaterial, eine sehr authentische Reproduktion eines Schallereignisses.
Schon wenige separate Übertragungskanäle sind
für viele
Anwendungen ausreichend. Meist sind nicht viele einzelne Schallquellen
gleichzeitig aktiv. Ihre Wiedergabe wird nicht den Eindruck erwecken,
dass nur wenige Monokanäle übertragen
würden,
denn jede primäre
Schallquelle erzeugt ihr eigenes, dreidimensionales Schallfeld.
-
Über die
Zahl der Übertragungskanäle hinaus
können
Schallereignisse dann dargestellt werden, wenn sie von dicht benachbarten
Quellen stammen und einen gemeinsamen Kanal benutzen, oder wenn
sie nicht gleichzeitig mit einer anderen Schallquelle aktiv sind.
Die Zusatzdaten wechseln dann temporär auf die andere Quelle.
-
Nur
wenige Übertragungen
werden in absehbarer Zeit direkt für das beschriebene Verfahren
produziert sein. Solange ist es wichtig, dass herkömmliche
Aufnahmen, ergänzt
durch nachträgliche
Zusatzinformationen, deutlich realistischer reproduziert werden
können.
-
Wie
weiter oben beschrieben, kann durch die Transformation des frühen Schallfeldes
selbst eine alte Monoaufnahme in einer völlig neuen akustischen Dimension
dargestellt werden. In dieser Weise kannte auch der Center-Kanal
einer sourround-Wiedergabe, in Korrespondenz zur zugehörigen Bildinformation,
deutlich aufgewertet werden.
-
Für die linken
und rechten Kanäle
wird, genau wie bei der Stereowiedergabe, abhängig vom Genre ein akustisch
passender, virtueller Aufnahmeraum aus der Bibliothek ausgesucht.
In diesem Raum wird wieder ein Zuhörer plaziert, vor dem die linken und
rechten Lautsprecherboxen als virtuelle Schallquellen, sogenannte
virtual panning spots, aufgestellt sind.
-
Der
Rest der Reproduktion unterscheidet sich nicht von der einer natürlichen
Schallquelle an dieser Position. Es lassen sich dann noch die gröbsten Fehler
der nun wieder "herkömmlichen", virtuellen Lautsprecherwiedergabe
in einem virtuellen Raum, elektronisch ausgleichen.
-
Analoges
gilt für
die, über
die Decken- Reflexion generierten, hinteren Lautsprecher. So steht
insgesamt für
die Wiedergabe von herkömmlichen
sourround- Produktionen ein Verfahren zur Verfügung, das nicht nur kompatibel
ist, sondern das die Wiedergabe signifikant verbessert.
-
Es
entsteht ein wesentlich vergrößerter sweet-spot,
der fast auf den gesamten Wiedergaberaum ausgedehnt ist, weil die
Winkel-Änderungen und
die relativen Abstands-Änderungen
zu den weiter entfernten „ Boxen" deutlich geringer
sind, als bei realen Lautsprechern im Wiedergaberaum, wenn sich
der Zuhörer
darin bewegt.
-
Die
bisherige Beschreibung hat nur aufgezeigt, wie ein größerer Aufnahmeraum
in einem kleineren Wiedergaberaum dargestellt werden kann. Sicher
der Regelfall für
Heimwiedergabe. Dabei werden von der Lautsprechermatrix frühe Reflektionen nachgebildet,
die gegenüber
der direkten Welle verzögert
abgestrahlt werden.
-
Doch
auch der umgekehrte Fall ist ohne Modifikationen am System möglich, selbst
die beschriebenen Algorithmen zur Positionierung der virtuellen Spiegelschallquellen
bleiben gleich.
-
Die
Samples der digitalisierten Audiokanäle werden in WFS- Systemen
ohnehin für
einige hundert Millisekunden zwischengespeichert, um sie für die einzelnen
Lautsprecher sequentiell auslesen zu können. Also spielt es auch keine
Rolle, ob zuerst die direkte Welle und dann die Reflektionen wiedergegeben
werden, oder ob die Matrix die Reflexionen schon auf ihren Weg schickt,
noch bevor die direkte Welle erzeugt wird. Im Ergebnis wird dann
ein Raum dargestellt, der kleiner ist als der Ausgangsraum.
-
Das
ist nicht nur interessant, um zum Beispiel Stimmen aus dem Innenraum
eines PKW ins Wohnzimmer zu quetschen. Ganz neue Perspektiven tun
sich damit in der Beschallungstechnik auf.
-
In
einen zu großen
Saal, bei dem lange Schallwege der ersten Reflexionen ein psychoakustisch
ungünstiges
Schallfeld erzeugen, kann ein kleinerer, akustisch günstiger
virtueller Raum „hineinkonstruiert" werden. Alles andere
genau nach dem beschriebenen Verfahren. Allerdings muß die Publikumsfläche immer
noch in diesen kleineren virtuellen Saal hineinpassen, außerhalb
seiner Grenzen kommt es zu akustischen Konfusionen.
-
Nichts
spricht dagegen, dass der Aufnahmeraum auch gleichzeitig der Wiedergaberaum
ist. Nur an die Signalverarbeitung des Systems müssen dann höhere Anforderungen gestellt
werden, sie müßte annähernd in
Echtzeit arbeiten. Wenn ein Redner in ein Mikrofon spricht, lassen
ihn zu hohe Verzögerungszeiten
sonst ins Stottern kommen.
-
Vorzug
eines solchen Systems ist es, das sich der Schall von der großflächigen Matrix
sehr gezielt ausrichten läßt. Die
direkte Welle kann bei geeigneter Matrixanordnung gezielt schräg von oben auf
das Publikum gerichtet werden, dort würde sie zum überwiegenden
Teil absorbiert. Auch die ersten schallstarken Reflexionen lassen
sich über
glatte Begrenzungsflächen
gezielt ausrichten.
-
Das
eröffnet
eine sehr interessante Anwendungsmöglichkeit: Der Schall kann
nur auf einen Teilbereich der Publikumsfläche ausgerichtet werden. Zum
Beispiel auf die Sitzplätze
der rechten Seite, dort wo die fremdsprachigen Gäste sitzen. Links wäre die Landessprache
zu hören.
-
Nicht
ohne Übersprechen
vom anderen Bereich. Dessen Lautstärke würde im wesentlichen durch den
Schallabsorbtionsgrad der Publikumsfläche bestimmt. In einem Saal
mittlerer Nachhallzeit wären
bei dicht besetzter Publikumsfläche
mit Polsterbestuhlung etwa 10 dB Pegelunterschied zu erwarten, mit
schweren Polstersesseln wären
ca. 15 dB realistisch. [6]
-
Wegen
des bekannten Party-Effekts würde sich
dann jeder Zuhörer
auf sein Signal konzentrieren. Damit wären solche Werte ausreichend
und die Zuhörer
würden
die leiseren fremdsprachigen Signale sicher akzeptieren, wenn sie
dafür auf
ihre lästigen Kopfhörer verzichten
könnten.
-
Bei
ständig
wechselndem Publikum, beispielsweise in Ausstellungen und auf Messen,
bringen diese Kopfhörer
erhebliche hygienische Probleme. Der auf einen einzelnen Platz fokussierte
Schall der beschriebenen Matrix könnte das Problem, auch mit
preiswerten Einzelstrahlern, lösen.
Das Schallfeld ließe
sich sogar dem bewegten Zuhörer
nachführen. Mit
den bekannten Acrylglas-Kuppeln
für diese
Fokussierung ist das nicht möglich.
-
Bei
praktisch aufgebauten Anlagen mit line-Arrays hat sich herausgestellt,
daß der
Einfluß von
Artefakten, die durch die partielle Unterbrechung der Schallzeilen
entstehen, relativ gering ist. Dort, wo eine Tür ist, kann die Zeile relativ
breit unterbrochen werden, ohne das es subjektiv wahrnehmbar wird.
-
Gleiches
wird auch für
die Matrix gelten. Als einfache Anwendung scheint es deshalb sogar
noch sinnvoll, das Verfahren auf die frontale Schallwand einzeln
aufgestellter Lautsprecherboxen anzuwenden.
-
Die
Reproduktion einer solchen Anordnung wird natürlich weit hinter der Natürlichkeit
des Schallfeldes der Matrix zurückbleiben,
aber schon mit wenigen Einzelstrahlern werden die oben beschriebenen Fehler
herkömmlicher
Lautsprecherboxen, zumindest im höheren Frequenzbereich, weniger
deutlich sein.
-
Und
schon der Versuch, wenigstens die stärksten Reflektionen überhaupt
zu generieren, wird eine deutlich verbesserte subjektive Wahrnehmung hervorrufen.
Auch wenn sie nicht in der beschriebenen Weise aufwendig generiert,
sondern nur durch einige Standardsetups für feste Verzögerungszeiten erzeugt
wurden. Mit solchen einfachen zusätzlichen verzögerten Signalen
kann selbst eine übliche
d'Appolito-Lautsprecheranordnung
schon eine überraschende
Räumlichkeit
erzeugen.
-
Bezugszeichenliste
-
- [1] LI XU, Shigeto Furkawa, John. C. Mmiddlebrooks, "Sensivity to Sound-Source-Elevation
in Nontropic Auditory Cortex",
The Journal of Neurophysiology Vol. 80 No. August 1998, pp. 882–894
- [2] „The
CARROUSO project,": http://www.emt.iis.fhg.de/projects/carrouso/
- [3] T.Caulkins, E.Corteel, O. Warusfel, „Wave field synthesis interaction
with the listening environment, improvements in the reproduction
of virtual sources situatet inside the listening room" , Proc. of the 6th Int. Conference Audio Effects (DAFx-03),
London, UK, September 8–11,
2003
- [4] Wittek, Helmut: http://www.irt.de/wittek/hauptmikrofon/wittek
wfs litreview.pdf
- [5] S. Spors, A. Kuntz, R. Rabenstein, „Listening room compensation
for wave field synthesis",
IEEE International Conference on Multimedia and Expo (ICME), Baltimore,
Maryland, USA, July 2003
- [6] Fasold, Sonntag, Winkler, „Bauphysikalische Entwurfslehre
Bau- und Raumakustik" VEB
Verlag für Bauwesen,
1987, ISBN 3-345-00140-3