EP1671516B1

EP1671516B1 - Vorrichtung und verfahren zum erzeugen eines tieftonkanals

Info

Publication number: EP1671516B1
Application number: EP04797996A
Authority: EP
Inventors: Michael Beckinger; Sandra Brix
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2003-11-26
Filing date: 2004-11-18
Publication date: 2007-02-14
Anticipated expiration: 2024-11-18
Also published as: US20060280311A1; WO2005060307A1; CN100588286C; CN1906971A; EP1671516A1; US8699731B2; DE10355146A1; JP4255031B2; JP2007512740A; DE502004002926D1

Abstract

Zur Erzeugung eines Tieftonkanals für einen Tieftonlautsprecher, der an einer vorbestimmten Tieftonlautsprecherposition angeordnet ist, wird zunächst eine Mehrzahl von Audioobjekten bereitgestellt (900), wobei einem Audioobjekt eine Objektposition und eine Objektbeschreibung zugeordnet sind. Hierauf wird aufgrund der Objektbeschreibung eine Berechnung (906) eines Audioobjektskalierungswerts für jedes Audioobjekt durchgeführt, so daß ein Ist-Amplitudenzustand an einer Referenzwiedergabeposition einem Soll-Amplitudenzustand wenigstens nahe kommt. Hierauf wird jedes Objektsignal mit einem zugeordneten Audioobjektskalierungswert skaliert (910), um dann die skalierten Objektsignale zu summieren (914). Aus dem dort erhaltenen Summensignal wird hierauf ein Tieftonkanal für den Tieftonlautsprecher abgeleitet und dem entsprechenden Tieftonlautsprecher bereitgestellt (918). Aufgrund der Skalierung der einzelnen Objektsignale der Audioobjekte ist diese Vorgehensweise unabhängig von einer tatsächlichen Situation eines Multikanalwiedergabesystems im Hinblick auf die Anzahl und Dichte der Lautsprecher sowie im Hinblick auf die Größe des tatsächlich vorhandenen Vorführbereichs.

Description

Die vorliegende Erfindung bezieht sich auf das Erzeugen eines oder mehrerer Tieftonkanäle und insbesondere auf das Erzeugen von einem oder mehreren Tieftonkanälen in Zusammenhang mit einem Mehrkanal-Audiosystem, wie beispielsweise einem Wellenfeldsynthesesystem.
Es besteht ein steigender Bedarf an neuen Technologien und innovativen Produkten im Bereich der Unterhaltungselektronik. Dabei ist es eine wichtige Voraussetzung für den Erfolg neuer multimedialer Systeme, optimale Funktionalitäten bzw. Fähigkeiten anzubieten. Erreicht wird das durch den Einsatz digitaler Technologien und insbesondere der Computertechnik. Beispiele hierfür sind die Applikationen, die einen verbesserten realitätsnahen audiovisuellen Eindruck bieten. Bei bisherigen Audiosystemen liegt ein wesentlicher Schwachpunkt in der Qualität der räumlichen Schallwiedergabe von natürlichen, aber auch von virtuellen Umgebungen.
Verfahren zur mehrkanaligen Lautsprecherwiedergabe von Audiosignalen sind seit vielen Jahren bekannt und standardisiert. Alle üblichen Techniken besitzen den Nachteil, dass sowohl der Aufstellungsort der Lautsprecher als auch die Position des Hörers dem Übertragungsformat bereits eingeprägt sind. Bei falscher Anordnung der Lautsprecher im Bezug auf den Hörer leidet die Audioqualität deutlich. Ein optimaler Klang ist nur in einem kleinen Bereich des Wiedergaberaums, dem so genannten Sweet Spot, möglich.
Ein besserer natürlicher Raumeindruck sowie eine stärkere Einhüllung bei der Audiowiedergabe kann mit Hilfe einer neuen Technologie erreicht werden. Die Grundlagen dieser Technologie, die so genannte Wellenfeldsynthese (WFS; WFS = Wave-Field Synthesis), wurden an der TU Delft erforscht und erstmals in den späten 80er-Jahren vorgestellt (Berkhout, A.J.; de Vries, D.; Vogel, P.: Acoustic control by Wave-field Synthesis. JASA 93, 1993).
Infolge der enormen Anforderungen dieser Methode an Rechnerleistung und Übertragungsraten wurde die Wellenfeldsynthese bis jetzt nur selten in der Praxis angewendet. Erst die Fortschritte in den Bereichen der Mikroprozessortechnik und der Audiocodierung gestatten heute den Einsatz dieser Technologie in konkreten Anwendungen. Erste Produkte im professionellen Bereich werden nächstes Jahr erwartet. In wenigen Jahren sollen auch erste Wellenfeldsynthese-Anwendungen für den Konsumerbereich auf den Markt kommen.
Die Grundidee von WFS basiert auf der Anwendung des Huygens'schen Prinzips der Wellentheorie:
Jeder Punkt, der von einer Welle erfasst wird, ist Ausgangspunkt einer Elementarwelle, die sich kugelförmig bzw. kreisförmig ausbreitet.
Angewandt auf die Akustik kann durch eine große Anzahl von Lautsprechern, die nebeneinander angeordnet sind (einem so genannten Lautsprecherarray), jede beliebige Form einer einlaufenden Wellenfront nachgebildet werden. Im einfachsten Fall, einer einzelnen wiederzugebenden Punktquelle und einer linearen Anordnung der Lautsprecher, müssen die Audiosignale eines jeden Lautsprechers mit einer Zeitverzögerung und Amplitudenskalierung so gespeist werden, dass sich die abgestrahlten Klangfelder der einzelnen Lautsprecher richtig überlagern. Bei mehreren Schallquellen wird für jede Quelle der Beitrag zu jedem Lautsprecher getrennt berechnet und die resultierenden Signale addiert. In einem Raum mit reflektierenden Wänden können auch Reflexionen als zusätzliche Quellen über das Lautsprecherarray wiedergegeben werden. Der Aufwand bei der Berechnung hängt daher stark von der Anzahl der stark von der Anzahl der Schallquellen, den Reflexionseigenschaften des Aufnahmeraums und der Anzahl der Lautsprecher ab.
Der Vorteil dieser Technik liegt im Besonderen darin, dass ein natürlicher räumlicher Klangeindruck über einen großen Bereich des Wiedergaberaums möglich ist. Im Gegensatz zu den bekannten Techniken werden Richtung und Entfernung von Schallquellen sehr exakt wiedergegeben. In beschränktem Maße können virtuelle Schallquellen sogar zwischen dem realen Lautsprecherarray und dem Hörer positioniert werden.
Obgleich die Wellenfeldsynthese für Umgebungen gut funktioniert, deren Beschaffenheiten bekannt sind, treten doch Unregelmäßigkeiten auf, wenn sich die Beschaffenheit ändert bzw. wenn die Wellenfeldsynthese auf der Basis einer Umgebungsbeschaffenheit ausgeführt wird, die nicht mit der tatsächlichen Beschaffenheit der Umgebung übereinstimmt.
Die Technik der Wellenfeldsynthese kann jedoch ebenfalls vorteilhaft eingesetzt werden, um eine visuelle Wahrnehmung um eine entsprechende räumliche Audiowahrnehmung zu ergänzen. Bisher stand bei der Produktion in virtuellen Studios die Vermittlung eines authentischen visuellen Eindrucks der virtuellen Szene im Vordergrund. Der zum Bild passende akustische Eindruck wird in der Regel durch manuelle Arbeitsschritte in der sogenannten Postproduktion nachträglich dem Audiosignal aufgeprägt oder als zu aufwendig und zeitintensiv in der Realisierung eingestuft und daher vernachlässigt. Dadurch kommt es üblicherweise zu einem Widerspruch der einzelnen Sinnesempfindungen, der dazu führt, daß der entworfene Raum, d. h. die entworfene Szene, als weniger authentisch empfunden wird.
In der Mehrzahl der Fälle wird ein Konzept verfolgt, bei dem es darum geht, einen akustischen Gesamteindruck der visuell abgebildeten Szenerie zu bekommen. Dieses lässt sich gut mit dem aus der Bildgestaltung stammenden Begriff der "Totalen" umschreiben. Dieser "totale" Klangeindruck bleibt meist über alle Einstellungen in einer Szene konstant, obwohl sich der optische Blickwinkel auf die Dinge meist stark ändert. So werden optische Details durch entsprechende Einstellungen herausgehoben oder in den Hintergrund gestellt. Auch Gegenschüsse bei der filmischen Dialoggestaltung werden vom Ton nicht nachvollzogen.
Daher besteht der Bedarf, den Zuschauer akustisch in eine audiovisuelle Szene einzubetten. Hierbei bildet die Leinwand oder Bildfläche die Blickrichtung und den Blickwinkel des Zuschauers. Dies bedeutet, daß der Ton dem Bild in der Form nachgeführt werden soll, daß er stets mit dem gesehenen Bild übereinstimmt. Dies wird insbesondere für virtuelle Studios noch wichtiger, da es typischerweise keine Korrelation zwischen dem Ton der Moderation beispielsweise und der Umgebung gibt, in der sich der Moderator gerade befindet. Um einen audiovisuellen Gesamteindruck der Szene zu bekommen, muß ein zum gerenderten Bild passender Raumeindruck simuliert werden. Eine wesentliche subjektive Eigenschaft bei einem solchen klanglichen Konzept ist in diesem Zusammenhang der Ort einer Schallquelle, wie ihn ein Betrachter beispielsweise einer Kinoleinwand empfindet.
Im Audiobereich läßt sich also durch die Technik der Wellenfeldsynthese (WFS) ein guter räumlicher Klang für eine großen Hörerbereich erzielen. Wie es ausgeführt worden ist, basiert die Wellenfeldsynthese auf dem Prinzip von Huygens, nach welchem sich Wellenfronten durch Überlagerung von Elementarwellen formen und aufbauen lassen. Nach mathematisch exakter theoretischer Beschreibung müßten unendlich viele Quellen in unendlich kleinem Abstand für die Erzeugung der Elementarwellen genutzt werden. Praktisch werden jedoch endlich viele Lautsprecher in einem endlich kleinen Abstand zueinander genutzt. Jeder dieser Lautsprecher wird gemäß dem WFS-Prinzip mit einem Audiosignal von einer virtuellen Quelle, das ein bestimmtes Delay und einen bestimmten Pegel hat, angesteuert. Pegel und Delays sind in der Regel für alle Lautsprecher unterschiedlich.
Wie es bereits ausgeführt worden ist, arbeitet das Wellenfeldsynthesesystem auf der Basis des Huygens-Prinzips und rekonstruiert eine gegebene Wellenform beispielsweise einer virtuellen Quelle, die in einem bestimmten Abstand zu einem Vorführbereich bzw. zu einem Hörer in dem Vorführbereich angeordnet ist durch eine Vielzahl von Einzelwellen. Der Wellenfeldsynthesealgorithmus erhält somit Informationen über die tatsächliche Position eines Einzellautsprechers aus dem Lautsprecherarray, um dann für diesen Einzellautsprecher ein Komponentensignal zu berechnen, das dieser Lautsprecher dann letztendlich abstrahlen muß, damit beim Zuhörer eine Überlagerung des Lautsprechersignals von dem einen Lautsprecher mit den Lautsprechersignalen der anderen aktiven Lautsprecher eine Rekonstruktion dahingehend durchführt, daß der Hörer den Eindruck hat, daß er nicht von vielen Einzellautsprechern "beschallt" wird, sondern lediglich von einem einzigen Lautsprecher an der Position der virtuellen Quelle.
Für mehrere virtuelle Quellen in einem Wellenfeldsynthesesetting wird der Beitrag von jeder virtuellen Quelle für jeden Lautsprecher, also das Komponentensignal der ersten virtuellen Quelle für den ersten Lautsprecher, der zweiten virtuellen Quelle für den ersten Lautsprecher, etc. berechnet, um dann die Komponentensignale aufzuaddieren, um schließlich das tatsächliche Lautsprechersignal zu erhalten. Im Falle von beispielsweise drei virtuellen Quellen würde die Überlagerung der Lautsprechersignale aller aktiven Lautsprecher beim Hörer dazu führen, daß der Hörer nicht den Eindruck hat, daß er von einem großen Array von Lautsprechern beschallt wird, sondern daß der Schall, den er hört, lediglich von drei an speziellen Positionen positionierten Schallquellen kommt, die gleich den virtuellen Quellen sind.
Die Berechnung der Komponentensignale erfolgt in der Praxis meist dadurch, daß das einer virtuellen Quelle zugeordnete Audiosignal je nach Position der virtuellen Quelle und Position des Lautsprechers zu einem bestimmten Zeitpunkt mit einer Verzögerung und einem Skalierungsfaktor beaufschlagt wird, um ein verzögertes und/oder skaliertes Audiosignal der virtuellen Quelle zu erhalten, das das Lautsprechersignal unmittelbar darstellt, wenn nur eine virtuellen Quelle vorhanden ist, oder das nach Addition mit weiteren Komponentensignalen für den betrachteten Lautsprecher von anderen virtuellen Quellen dann zum Lautsprechersignal für den betrachteten Lautsprecher beiträgt.
Typische Wellenfeldsynthesealgori thmen arbeiten unabhängig davon, wie viele Lautsprecher im Lautsprecherarray vorhanden sind. Die der Wellenfeldsynthese zugrundeliegende Theorie besteht darin, daß jedes beliebige Schallfeld durch eine unendlich hohe Anzahl von Einzellautsprechern exakt rekonstruiert werden kann, wobei die einzelnen Einzellautsprecher unendlich nahe zueinander angeordnet sind. In der Praxis kann jedoch weder die unendlich hohe Anzahl noch die unendlich nahe Anordnung realisiert werden. Statt dessen existiert eine begrenzte Anzahl von Lautsprechern, die zudem in bestimmten vorgegebenen Abständen zueinander angeordnet sind. Damit wird in realen Systemen immer nur eine Annäherung an die tatsächliche Wellenform erreicht, die stattfinden würde, wenn die virtuelle Quelle tatsächlich vorhanden wäre, also eine reale Quelle sein würde.
Ferner existieren verschiedene Szenarien, dahingehend, daß das Lautsprecherarray nur, wenn ein Kinosaal betrachtet wird, z. B. auf der Seite der Kinoleinwand angeordnet ist. In diesem Fall würde das Wellenfeldsynthesemodul Lautsprechersignale für diese Lautsprecher erzeugen, wobei die Lautsprechersignale für diese Lautsprecher normalerweise dieselben sein werden wie für entsprechende Lautsprecher in einem Lautsprecherarray, das sich nicht nur über die Seite eines Kinos beispielsweise erstreckt, an der die Leinwand angeordnet ist, sondern das auch links, rechts und hinter dem Zuhörerraum angeordnet ist. Dieses "360°"-Lautsprecherarray wird natürlich eine bessere Annäherung an ein exaktes Wellenfeld schaffen als lediglich ein einseitiges Array, beispielsweise vor den Zuschauern. Dennoch sind die Lautsprechersignale für die Lautsprecher, die sich vor den Zuschauern befinden, in beiden Fällen die gleichen. Dies bedeutet, daß ein Wellenfeldsynthesemodul typischerweise keine Rückkopplung dahingehend erhält, wie viele Lautsprecher vorhanden sind bzw. ob es sich um ein einseitiges oder mehrseitiges oder gar um ein 360°-Array handelt oder nicht. Anders ausgedrückt berechnet eine Wellenfeldsyntheseeinrichtung ein Lautsprechersignal für einen Lautsprecher aufgrund der Position des Lautsprechers und unabhängig davon, welche weiteren Lautsprecher noch vorhanden sind oder nicht vorhanden sind.
Hierin besteht zwar eine wesentliche Stärke des Wellenfeldsynthesealgorithmus dahingehend, daß er optimal modular anpaßbar an verschiedene Gegebenheiten ist, indem einfach die Koordinaten der vorhandenen Lautsprecher in ganz unterschiedlichen Vorführräumen gegeben sind. Nachteilig ist jedoch, daß neben der unter Umständen hinnehmbaren schlechteren Rekonstruktion des aktuellen Wellenfeldes erhebliche Pegelartefakte entstehen. So ist für einen realen Eindruck nicht nur entscheidend, in welcher Richtung sich die virtuelle Quelle bezüglich des Zuhörers befindet, sondern auch wie laut der Zuhörer die virtuelle Quelle hört, also welcher Pegel beim Zuhörer aufgrund einer speziellen virtuellen Quelle "ankommt". Der bei einem Zuhörer ankommende Pegel, der auf eine betrachtete virtuelle Quelle bezogen ist, ergibt sich aus der Überlagerung der einzelnen Signale der Lautsprecher.
Wird beispielsweise der Fall betrachtet, daß sich ein Lautsprecherarray von 50 Lautsprechern vor dem Zuhörer befindet, und daß das Audiosignal der virtuellen Quelle durch die Wellenfeldsyntheseeinrichtung in Komponentensignale für die 50 Lautsprecher abgebildet wird, derart, daß das Audiosignal mit unterschiedlicher Verzögerung und unterschiedlicher Skalierung von den 50 Lautsprechern gleichzeitig abgestrahlt wird, so empfindet ein Zuhörer der virtuellen Quelle einen Pegel der Quelle, der sich aus den Einzelpegeln der Komponentensignale der virtuellen Quelle in den einzelnen Lautsprechersignalen ergibt.
Wird dieselbe Wellenfeldsyntheseeinrichtung nunmehr für ein reduziertes Array verwendet, bei dem sich beispielsweise nur 10 Lautsprecher vor dem Zuhörer befinden, so ist es ohne weiteres einsichtig, daß der Pegel des Signals von der virtuellen Quelle, der sich am Ohr des Zuhörers ergibt, abgenommen hat, da gewissermaßen 40 Komponentensignale der nunmehr fehlenden Lautsprecher "fehlen".
Es kann auch der alternative Fall auftreten, bei dem sich z. B. zunächst links und rechts des Zuhörers Lautsprecher befinden, die in einer bestimmten Konstellation gegenphasig angesteuert werden, so daß sich die Lautsprechersignale von zwei gegenüberliegenden Lautsprechern aufgrund einer bestimmten von der Wellenfeldsyntheseeinrichtung berechneten Verzögerung aufheben. Wird nunmehr in einem reduzierten System z. B. auf die Lautsprecher auf der einen Seite des Zuhörers verzichtet, so erscheint die virtuelle Quelle auf einmal wesentlich lauter als sie eigentlich sein dürfte.
Während für statische Quellen zur Pegelkorrektur noch an konstante Faktoren gedacht werden könnte, ist diese Lösung dann nicht mehr tragbar, wenn die virtuellen Quellen nicht statisch sind, sondern sich bewegen. Dies ist gerade ein wesentliches Merkmal der Wellenfeldsynthese, daß sie auch und besonders sich bewegende virtuelle Quellen verarbeiten kann. Eine Korrektur mit einem konstanten Faktor würde hier zu kurz greifen, da der konstante Faktor zwar für eine Position stimmen würde, jedoch für eine andere Position der virtuellen Quelle Artefakt-steigernd wirken würde.
Wellenfeldsyntheseeinrichtungen sind ferner in der Lage, mehrere verschiedene Quellenarten nachzubilden. Eine prominente Quellenform ist die Punktquelle, bei der der Pegel proportional 1/r abnimmt, wobei r der Abstand zwischen einem Zuhörer und der Position der virtuellen Quelle ist. Eine andere Quellenform ist eine Quelle, die ebene Wellen aussendet. Hier bleibt der Pegel unabhängig von der Entfernung zum Hörer konstant, da ebene Wellen durch Punktquellen erzeugt werden können, die in einem unendlichen Abstand angeordnet sind.
Gemäß der Wellenfeldsynthesetheorie stimmt bei zweidimensionalen Lautsprecheranordnungen die Pegeländerung abhängig von r bis auf einen vernachlässigbaren Fehler mit der natürlichen Pegeländerung überein. Je nach Position der Quelle können sich jedoch unterschiedliche, zum Teil erhebliche Fehler im absoluten Pegel ergeben, welche aus der Nutzung einer endlichen Anzahl von Lautsprechern statt der theoretisch geforderten unendlichen Anzahl von Lautsprechern resultiert, wie es vorstehend dargelegt worden ist.
Eine weitere Problematik, die bei Mehrkanalwiedergabesystemen und insbesondere bei Wellenfeldsynthesesystemen existiert, die nicht nur beispielsweise fünf oder sieben Lautsprecher verwenden, sondern eine wesentlich höhere Anzahl von Lautsprechern verwenden, besteht darin, daß die Lautsprecher aufgrund ihrer hohen Anzahl zu erheblichen Kosten führen können. Um die Kosten der Lautsprecher zu reduzieren, wird bei solchen bestehenden Fünf-Kanal-Systemen oder Sieben-Kanal-Systemen das sogenannte Subwooferprinzip eingesetzt. Das Subwooferprinzip dient bei Multikanalwiedergabesystemen zur Einsparung von teuren und großen Tieftonlautsprechern. Verwendet wird hierbei ein Tieftonkanal, der nur Musiksignale mir Frequenzen tiefer einer Grenzfrequenz von etwa 120 Hz enthält. Dieser Tieftonkanal steuert einen Tieftonlautsprecher mit großer Membranfläche an, womit hohe Schalldrücke gerade bei tiefen Frequenzen erzielt werden.
Beim Subwooferprinzip wird ausgenutzt, daß das menschliche Gehör tieffrequente Töne in der Richtung sehr schwer lokalisieren also orten kann. In derzeitigen Systemen wird bereits bei der Tonmischung ein extra Tieftonkanal für eine spezielle Lautsprecheranordnung (räumliche Anordnung) gemischt. Beispiele für solche Multikanalwiedergabesysteme sind Dolby Digital, Sony SDDS und DTS. Bei diesen Multikanalformaten kann der Subwooferkanal unabhängig von der zu beschallenden Raumgröße gemischt werden, da sich die räumlichen Verhältnisse nur im maßstäblichen Sinne verändern. Die Lautsprecheranordnung bleibt maßstäblich die gleiche.
Mit der Wellenfeldsynthese (engl. Wave Field Synthesis - WFS) kann ein großer Zuschauerbereich beschallt werden. Schallereignisse können in ihrer räumlichen Tiefe wiedergegeben werden. Zu diesem Zweck wird im Zuschauerbereich das komplette Schallfeld der einzelnen Schallereignisse reproduziert. Dies erfolgt durch eine große Anzahl von Lautsprechern. Für große Installationen werden etwa 500 oder mehr Lautsprechersysteme benötigt. Wollte man jedes einzelne Lautsprechersystem mit einem leistungsstarken Tieftonlautsprecher ausrüsten, würden sehr hohe Kosten entstehen.
Es wurde erwähnt, daß für bestehende Multikanalformate eine spezielle Lautsprecheranordnung erforderlich ist, um einen speziellen Subwooferkanal zu mischen. Allerdings kann die Lautsprecheranordnung maßstäblich verändert werden, ohne die entsprechende Mischung ändern zu müssen. Das Verhältnis der Abstände der einzelnen Lautsprecher zueinander bleibt bestehen. Dies alles ist jedoch bei der WFS nicht möglich, da die Anzahl der Lautsprecherkanäle von dem Umfang der zu beschallenden Fläche des WFS-Wiedergabesystems abhängt. Deshalb können auch nicht die einzelnen Lautsprecherkanäle abgespeichert werden, was zudem recht speicheraufwendig wäre, wenn man Systeme mit 500 oder mehr Audiokanälen betrachtet. Deshalb werden nur die zu simulierenden, virtuellen Schallereignisse abgespeichert. Erst bei der Wiedergabe werden die einzelnen Lautsprecherkanäle mit Hilfe des WFS-Algorithmus berechnet.
Zum einen hängt also die Anzahl der Lautsprecherkanäle mit dem Umfang der Zuschauerfläche zusammen. Zusätzlich wird die Anzahl der Lautsprecherkanäle dadurch bestimmt, wie dicht die Lautsprecher auf den Umfang der zu beschallenden Fläche verteilt sind. Von dieser Dichte hängt die Güte des WFS-Wiedergabesystems ab. Mit der Anzahl der Lautsprecherkanäle und der Dichte der Lautsprecher hängt die Lautstärke zusammen, da sich ja alle Lautsprecherkanäle zu einem Wellenfeld aufsummieren. Die Lautstärke eines WFS-Systems ist also nicht ohne weiteres vorbestimmt. Die Lautstärke des Subwooferkanals ist allerdings mit den bekannten Parametern des elektrischen Verstärkers und des Lautsprechers vorbestimmt. Es ist demnach nicht möglich, eine Mischung eines Subwooferkanals von einem WFS-System fehlerfrei auf ein WFS-System mit anderer Lautsprecherdichte und Lautsprecheranzahl zu übertragen. Die Lautstärken von dem Tieftonsystem einerseits und von dem Mittel-/Hochtonsystem andererseits würden nicht übereinstimmen.
Die Aufgabe der vorliegenden Erfindung besteht darin, ein Konzept zum Erzeugen eines Tieftonkanals in einem Multikanalwiedergabesystem zu schaffen, das eine Reduzierung von Pegel-Artefakten ermöglicht.
Diese Aufgabe wird durch eine Vorrichtung zum Erzeugen eines Tieftonkanals nach Patentanspruch 1 oder ein Verfahren zum Erzeugen eines Tieftonkanals nach Patentanspruch 25 oder durch ein Computerprogramm nach Patentanspruch 26 gelöst.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß der Tieftonkanal für einen Tieftonlautsprecher bzw. daß mehrere Tieftonkanäle für mehrere Tieftonlautsprecher in einem Multikanalsystem nicht bereits in einem Tonmischvorgang erzeugt wird, der unabhängig von einem tatsächlichen Wiedergaberaum stattfindet, sondern daß auf den tatsächlichen Wiedergaberaum bezug genommen wird, indem die vorbestimmte Position des Tieftonlautsprechers einerseits sowie Eigenschaften von Audioobjekten, die typischerweise virtuelle Quellen darstellen, andererseits ebenfalls berücksichtigt werden, um den Tieftonkanal zu erzeugen. Insbesondere wird von Audioobjekten ausgegangen, wobei einem Audioobjekt eine Objektbeschreibung einerseits sowie ein Objektsignal andererseits zugeordnet ist. Abhängig von der Objektbeschreibung wird für jedes Audioobjektsignal ein Audioobjektskalierungswert berechnet, der dann dazu verwendet wird, um jedes Objektsignal zu skalieren, um dann die skalierten Objektsignale aufzusummieren, um ein Summensignal zu erhalten. Aus dem Summensignal wird dann der Tieftonkanal abgeleitet, der dem Tieftonlautsprecher zugeführt wird.
Für den Fall von Quellen, die ebene Wellen ausstrahlen, bei denen somit eine Position im Unendlichen angenommen wird, spielt die virtuelle Position der Quelle einerseits sowie eine Referenzwiedergabeposition andererseits, für die eine Referenzlautstärke gefordert wird, keine Rolle. Dies ist jedoch nicht der Fall bei üblichen punktförmig angenommenen Quellen, wie sie beispielsweise in einem Filmsetting dann auftreten, wenn Dialoge etc. stattfinden. In diesem Fall wird eine Skalierung des Audioobjektsignals, das von einer virtuellen Quelle stammt, die an einer virtuellen Position angeordnet ist, dahingehend vorgenommen, daß eine tatsächliche Lautstärke bzw. ein Ist-Amplitudenzustand aufgrund dieser virtuellen Quelle an der Referenzwiedergabeposition einem Soll-Amplitudenzustand entspricht. Der Soll-Amplitudenzustand hängt von der Lautstärke des Audioobjektsignals, das der virtuellen Quelle zugeordnet ist, und dem Abstand zwischen der virtuellen Position und der Referenzwiedergabeposition ab. Diese Berechnung von Audioobjektskalierungswerten wird für sämtliche virtuellen Quellen vorgenommen, um dann die Audioobjektsignale jeder virtuellen Quelle mit dem entsprechenden Skalierungswert zu skalieren.
Die skalierten Audioobjektsignale werden dann aufsummiert, um ein Summensignal zu erhalten. Aus diesem Summensignal wird dann wieder in dem Fall, bei dem nur ein einziger Tieftonlautsprecher vorhanden ist, der Tieftonkanal abgeleitet. Dies kann durch einfache Tiefpaßfilterung erfolgen.
An dieser Stelle sei darauf hingewiesen, daß die Tiefpaßfilterung bereits mit den noch unskalierten Audioobjektsignalen durchgeführt werden kann, so daß lediglich bereits Tiefpaßsignale weiter verarbeitet werden, so daß das Summensignal bereits der Tieftonkanal selbst ist.
Erfindungsgemäß wird es jedoch bevorzugt, die Extraktion des Tieftonkanals erst nach der Aufsummierung der skalierten Objektsignale durchzuführen, um eine möglichst gute Annäherung der Lautstärke der Tieftonsignale im Vorführraum einerseits und der Lautstärke der Mittel- und Hochtonsignale im Vorführraum andererseits zu erhalten.
Erfindungsgemäß wird somit ein Subwooferkanal nicht schon beim Tonmischvorgang aus den virtuellen Quellen, also dem Klangmaterial für die Wellenfeldsynthese gemischt. Die Mischung erfolgt statt dessen automatisch bei der Wiedergabe im Wellenfeldsynthesesystem unabhängig von der Größe des Systems und der Anzahl von Lautsprechern. Die Lautstärke des Subwoofersignals hängt dabei von der Anzahl und vom Umfang der umsäumten Fläche des Wellenfeldsynthesesystems ab. Selbst vorgeschriebene Lautsprecheranordnungen müssen nicht mehr eingehalten werden, da Lautsprecherposition und Lautsprecheranzahl in die Erzeugung des Tieftonkanals mit einbezogen werden.
Die vorliegende Erfindung ist nicht nur auf Wellenfeldsynthesesysteme begrenzt, sondern kann allgemein auf beliebige Multikanalwiedergabesysteme angewendet werden, bei denen die Mischung und Erzeugung, also das Rendering, der Wiedergabekanäle, also der Lautsprecherkanäle selbst, erst bei der tatsächlichen Wiedergabe erfolgt. Systeme dieser Art sind beispielsweise 5.1-Systeme, 7.1-Systeme etc.
Vorzugsweise wird die erfindungsgemäße Tieftonkanalerzeugung mit einer Pegelartefaktreduzierung kombiniert, um Pegelkorrekturen in einem Wellenfeldsynthesesystem nicht nur für Tieftonkanäle durchzuführen, sondern für sämtliche Lautsprecherkanäle, um unabhängig von Anzahl und Position der eingesetzten Lautsprecher bezüglich des verwendeten Wellenfeldsynthesealgorithmus zu sein.
Bei bevorzugten Ausführungsbeispielen der vorliegenden Erfindung, bei denen lediglich ein einziger Tieftonkanal und damit ein einziger Tieftonlautsprecher vorgesehen ist, wird der Tieftonlautsprecher nicht in einer Referenzwiedergabeposition angeordnet sein, für die eine optimale Pegelkorrektur durchgeführt wird. In diesem Fall wird das Summensignal erfindungsgemäß unter Berücksichtigung der Position des Tieftonlautsprechers unter Verwendung eines zu berechnenden Lautsprecherskalierungswerts skaliert. Diese Skalierung wird vorzugsweise lediglich eine Amplitudenskalierung und keine Phasenskalierung sein, wobei hier der Tatsache Rechnung getragen wird, daß das Ohr bei den im Tieftonkanal vorhandenen tiefen Frequenzen keine gute Lokalisierung hat, sondern lediglich eine genaue Amplituden-/Lautstärkewahrnehmung zeigt. Alternativ oder zusätzlich kann als Skalierung eine Phasenskalierung eingesetzt werden, falls eine solche in einem Anwendungsszenario erwünscht ist.
Für den Fall der Positionierung mehrerer Tieftonlautsprecher wird für jeden einzelnen Tieftonlautsprecher ein eigener Tieftonkanal erzeugt. Die Tieftonkanäle der einzelnen Tieftonlautsprecher unterscheiden sich vorzugsweise lediglich in ihrer Amplitude, nicht jedoch in dem Signal an sich. Alle Tieftonlautsprecher senden somit dasselbe Summensignal ab, jedoch mit unterschiedlicher Amplitudenskalierung, wobei die Amplitudenskalierung für einen einzelnen Tieftonlautsprecher abhängig vom Abstand des einzelnen Tieftonlautsprechers zum Referenzwiedergabepunkt erfolgt. Darüber hinaus wird erfindungsgemäß sichergestellt, daß die Gesamtlautstärke aller überlagerten Tieftonkanäle an der Referenzwiedergabeposition gleich der Lautstärke des Summensignals ist oder der Lautsprecher des Summensignals wenigstens innerhalb eines vorbestimmten Toleranzbereichs entspricht. Hierzu wird für jeden einzelnen Tieftonkanal ein eigener Lautsprecherskalierungswert berechnet, mit dem dann das Summensignal entsprechend skaliert wird, um den einzelnen Tieftonkanal zu erhalten.
Die Verwendung eines Subwooferkanals ist insbesondere dahingehend vorteilhaft, daß er zu einer deutlichen Preisreduktion führt, da die einzelnen Lautsprecher z. B. eines Wellenfeldsynthesesystems wesentlich preisgünstiger aufgebaut werden können, da sie keine Tieftoneigenschaften haben müssen. Dagegen genügt nur einer oder einige wenige, wie beispielsweise drei bis vier, Subwooferlautsprecher, um die sehr tiefen Frequenzen mit hohem Schalldruck durch eine entsprechend große Membranfläche zu realisieren.
Die vorliegende Erfindung ist ferner dahingehend vorteilhaft, daß der eine bzw. die mehreren Tieftonkanäle für beliebige Lautsprecheraufstellungen und Multikanalformate automatisch erzeugt werden kann, wobei dies insbesondere im Rahmen eines Wellenfeldsynthesesystems nur einen geringen Mehraufwand erfordert, da das Wellenfeldsynthesesystem ohnehin eine Pegelkorrektur durchführt.
Bezüglich der nötigen Anzahl von Tieftonlautsprechern sowie der optimalen Positionierung von einem oder mehreren Tieftonlautsprechern wird auf die Fachliteratur verwiesen, von der insbesondere Welti, Todd, "How Many Subwoofers are Enough", 112^th AES Conv. Paper 5602, Mai 2002, München, Deutschland, Martens, "The impact of decorrelated low-frequency reproduction on auditory spatial imagery: Are two subwoofers better than one?", 16^th AES Conf. Paper, April 1999, Rovaniemi, Finnland, genannt werden.
Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung, bei dem lediglich ein einziger Tieftonlautsprecher eingesetzt wird, wird zunächst die Einzellautstärke und vorzugsweise auch Verzögerung jeder virtuellen Quelle, also jedes Klangobjekt bzw. Audioobjekt, bezogen auf die Referenzwiedergabeposition berechnet. Hierauf wird das Audiosignal jeder virtuellen Quelle entsprechend skaliert und verzögert, um dann alle virtuellen Quellen aufzusummieren. Hierauf wird die Gesamtlautstärke und Verzögerung des Subwoofers in Abhängigkeit von dessen Abstand zum Bezugspunkt berechnet, falls der Subwoofer nicht bereits im Bezugspunkt angeordnet ist.
Im Falle von mehreren Subwoofern wird es bevorzugt, zunächst die Einzellautstärken aller Subwoofer in Abhängigkeit von ihren Abständen zum Bezugspunkt zu bestimmen. Hierbei wird es bevorzugt, als Randbedingung einzuhalten, daß die Summe aller Subwooferkanäle gleich der der Referenzlautstärke an der Referenzwiedergabeposition ist, die vorzugsweise dem Mittelpunkt des Wellenfeldsynthesesystems entspricht. Es werden also entsprechende Skalierungsfaktoren pro Subwoofer berechnet, wobei jedoch zunächst wieder Einzellautstärke und Verzögerung jeder virtuellen Quelle bezogen auf den Referenzpunkt bestimmt werden. Dann wird wieder jede virtuelle Quelle entsprechend skaliert und optional verzögert, um dann alle virtuellen Quellen zu dem Summensignal aufzusummieren, das dann mit den einzelnen Skalierungsfaktoren für jeden Subwooferkanal skaliert wird, um die einzelnen Tieftonkanäle für die verschiedenen Tieftonlautsprecher zu erhalten.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:

Fig. 1: ein Blockschaltbild der erfindungsgemäßen Vorrichtung zum Pegel-Korrigieren in einem Wellenfeldsynthesesystem;
Fig. 2: ein Prinzipschaltbild einer Wellenfeldsyntheseumgebung, wie sie für die vorliegende Erfindung einsetzbar ist;
Fig. 3: eine detailliertere Darstellung des in Fig. 2 gezeigten Wellenfeldsynthesemoduls;
Fig. 4: ein Blockschaltbild einer erfindungsgemäßen Einrichtung zum Ermitteln des Korrekturwerts gemäß einem Ausführungsbeispiel mit Nachschlagtabelle und gegebenenfalls Interpolationseinrichtung;
Fig. 5: ein weiteres Ausführungsbeispiel der Einrichtung zum Ermitteln von Fig. 1 mit Sollwert/Istwert-Ermittlung und anschließendem Vergleich;
Fig. 6a: ein Blockschaltbild eines Wellenfeldsynthesemoduls mit eingebetteter Manipulationseinrichtung zur Manipulation der Komponentensignale;
Fig. 6b: ein Blockschaltbild eines weiteren Ausführungsbeispiels der vorliegenden Erfindung mit einer vorgeschalteten Manipulationseinrichtung;
Fig. 7a: eine Skizze zur Erläuterung des SollAmplitudenzustands an einem Optimal-Punkt in einem Vorführbereich;
Fig. 7b: eine Skizze zur Erläuterung des Ist-Amplitudenzustands an einem Optimal-Punkt in dem Vorführbereich;
Fig. 8: ein prinzipielles Blockschaltbild eines Wellenfeldsynthesesystems mit Wellenfeldsynthesemodul und Lautsprecherarray in einem Vorführbereich;
Fig. 9: ein Blockschaltbild einer erfindungsgemäßen Vorrichtung zum Erzeugen eines Tieftonkanals;
Fig. 10: eine bevorzugte Ausgestaltung der Einrichtung zum Bereitstellen des Tieftonkanals für mehrere Tieftonlautsprecher; und
Fig. 11: eine schematische Darstellung eines Vorführbereichs mit einer Mehrzahl von Einzellautsprechern sowie zwei Subwoofern.

Wie es bereits ausgeführt worden ist, werden durch den Wellenfeldsynthesealgorithmus für jeden Lautsprecherkanal und jede virtuelle Quelle sowohl Lautstärke als auch Verzögerung berechnet. Dabei muß die Position des einzelnen Lautsprechers bekannt sein. Hierzu wird es erfindungsgemäß bevorzugt, die Gesamtlautstärke aller Lautsprecher in einem Bezugspunkt des Wellenfeldsynthesewiedergabesystems auf eine absolute Referenzlautstärke, also den Soll-Amplitudenzustand, zu skalieren. Diese Skalierung der einzelnen Audioobjektsignale für die einzelnen Wellenfeldsynthesesystemlautsprecher, also die Einzellautsprecher des Arrays, basiert auf der Erkenntnis, daß die Unzulänglichkeiten eines Wellenfeldsynthesesystems mit einer (praktisch realisierbaren) endlichen Anzahl von Lautsprechern dahingehend zumindest abgemildert werden können, wenn eine PegelKorrektur durchgeführt wird, dahingehend, daß entweder das einer virtuellen Quelle zugeordnete Audiosignal vor der Wellenfeldsynthese oder die Komponentensignale für verschiedene Lautsprecher, die auf eine virtuelle Quelle zurückgehen, nach der Wellenfeldsynthese unter Verwendung eines Korrekturwerts manipuliert werden, um eine Abweichung zwischen einem Soll-Amplitudenzustand in einem Vorführbereich und einem Ist-Amplitudenzustand in dem Vorführbereich zu reduzieren. Der Soll-Amplitudenzustand ergibt sich dadurch, daß abhängig von der Position der virtuellen Quelle, und z. B. abhängig von einem Abstand eines Zuhörers bzw. eines optimalen Punkts in einem Vorführbereich zu der virtuellen Quelle und gegebenenfalls unter Berücksichtigung der Wellenart ein Soll-Pegel als Beispiel für einen Soll-Amplitudenzustand ermittelt wird, und daß ferner ein Ist-Pegel als Beispiel für einen Ist-Amplitudenzustand beim Hörer ermittelt wird. Während der Soll-Amplitudenzustand unabhängig von der tatsächlichen Gruppierung und Art der Einzellautsprecher lediglich auf der Basis der virtuellen Quelle bzw. deren Position ermittelt wird, wird die Ist-Situation unter Berücksichtigung der Positionierung, Art und Ansteuerung der Einzellautsprecher des Lautsprecherarrays berechnet.
So kann der Schallpegel am Ohr des Hörers im optimalen Punkt innerhalb des Vorführbereichs aufgrund eines Komponentensignale der virtuellen Quelle, das über einen Einzellautsprecher abgestrahlt wird, ermittelt werden. Entsprechend kann für die anderen Komponentensignale, die auf die virtuelle Quelle zurückgehen und über andere Lautsprecher abgestrahlt werden, ebenfalls der Pegel am Ohr des Hörers im optimalen Punkt innerhalb des Vorführbereichs ermittelt werden, um dann durch Zusammenfassung dieser Pegel den tatsächlichen Ist-Pegel am Ohr des Hörers zu erhalten. Hierzu kann die Übertragungsfunktion jedes einzelnen Lautsprechers sowie der Pegel des Signals an dem Lautsprecher und der Abstand des Zuhörers im betrachteten Punkt innerhalb des Vorführbereichs zu dem einzelnen Lautsprecher berücksichtigt werden. Für einfachere Ausführungen kann die Sendecharakteristik des Lautsprechers dahingehend angenommen werden, daß er als ideale Punktquelle arbeitet. Für aufwendigere Implementierungen kann jedoch auch die Richtcharakteristik des einzelnen Lautsprechers berücksichtigt werden.
Ein wesentlicher Vorteil dieses Konzepts besteht darin, daß bei einem Ausführungsbeispiel, bei dem Schallpegel betrachtet werden, lediglich multiplikative Skalierungen auftreten, dahingehend, daß für einen Quotient zwischen dem Soll-Pegel und dem Ist-Pegel, der den Korrekturwert ergibt, nicht der absolute Pegel beim Zuhörer oder der absolute Pegel der virtuellen Quelle erforderlich ist. Statt dessen hängt der Korrekturfaktor lediglich von der Position der virtuellen Quelle (und damit von den Positionen der Einzellautsprecher) sowie des optimalen Punkts innerhalb des Vorführbereichs ab. Diese Größen sind jedoch im Hinblick auf die Position des optimalen Punkts und die Positionen und Übertragungscharakteristika der einzelnen Lautsprecher fest vorgegeben und nicht von einem abgespielten Stück abhängig.
Daher kann das Konzept rechenzeiteffizient als Nachschlagtabelle implementiert werden, dahingehend, daß eine Nachschlagtabelle erzeugt und verwendet wird, die Position-Korrekturfaktor-Wertepaare umfaßt, und zwar für sämtliche oder einen wesentlichen Teil von möglichen virtuellen Positionen. In diesem Fall ist dann kein On-line-Sollwertermittlungs-, Istwertermittlungs- und Sollwert/Istwert-Vergleichsalgorithmus durchzuführen. Auf diese unter Umständen rechenzeitaufwändigen Algorithmen kann verzichtet werden, wenn auf der Basis einer Position einer virtuellen Quelle auf die Nachschlagtabelle zugegriffen wird, um von dort den für diese Position der virtuellen Quelle gültigen Korrekturfaktor zu ermitteln. Um die Rechen- und Speicher-Effizienz noch weiter zu steigern, wird es bevorzugt, lediglich relativ grob gerasterte Stützwert-Paare für Positionen und zugeordnete Korrekturfaktoren in der Tabelle abzuspeichern und Korrekturfaktoren für Positionswerte, die zwischen zwei Stützwerten liegen, einseitig, zweiseitig, linear, kubisch etc. zu interpolieren.
Alternativ kann es ferner in dem einen oder anderen Fall sinnvoll sein, einen empirischen Ansatz zu verwenden, dahingehend, daß Pegelmessungen durchgeführt werden. In einem solchen Fall würde eine virtuelle Quelle mit einem bestimmten Kalibrierungspegel an einer bestimmten virtuellen Position plaziert werden. Dann würde für ein reales Wellenfeldsynthesesystem ein Wellenfeldsynthesemodul die Lautsprechersignale für die einzelnen Lautsprecher berechnen, um schließlich am Hörer den tatsächlich aufgrund der virtuellen Quelle ankommenden Pegel zu messen. Ein Korrekturfaktor würde dann dahingehend bestimmt, daß er die Abweichung vom Sollpegel zum Istpegel zumindest reduziert oder vorzugsweise zu 0 bringt. Dieser Korrekturfaktor würde dann in der Nachschlagtabelle in Zuordnung zu der Position der virtuellen Quelle abgespeichert werden, um so nach und nach, also für viele Positionen der virtuellen Quelle, für ein bestimmtes Wellenfeldsynthesesystem in einem speziellen Vorführraum die gesamte Nachschlagtabelle zu erzeugen.
Zur Manipulation auf der Basis des Korrekturfaktors existieren mehrere Möglichkeiten. Bei einer Ausführungsform wird es bevorzugt, das Audiosignal der virtuellen Quelle, wie es beispielsweise in einem Audiotrack, der aus einem Tonstudio kommt, aufgezeichnet ist, mit dem Korrekturfaktor zu manipulieren, um dann erst das manipulierte Signal in ein Wellenfeldsynthesemodul einzuspeisen. Dies führt gewissermaßen automatisch dazu, daß somit alle Komponentensignale, die auf diese manipulierte virtuelle Quelle zurückgehen, ebenfalls entsprechend gewichtet sind, und zwar im Vergleich zu dem Fall, bei dem keine Korrektur gemäß der vorliegenden Erfindung vorgenommen worden ist.
Alternativ kann es für bestimmte Anwendungsfälle auch günstig sein, nicht auf das Ursprungs-Audiosignal der virtuellen Quelle einzugreifen, sondern in die durch das Wellenfeldsynthesemodul erzeugten Komponentensignale einzugreifen, um diese Komponentensignale alle vorzugsweise mit demselben Korrekturfaktor zu manipulieren. An dieser Stelle sei darauf hingewiesen, daß der Korrekturfaktor nicht unbedingt identisch für alle Komponentensignale sein muß. Dies wird jedoch in weiten Teilen bevorzugt, um nicht die relative Skalierung der Komponentensignale zueinander, die zur Rekonstruktion der tatsächlichen Wellensituation erforderlich ist, zu stark zu beeinträchtigen.
Ein Vorteil besteht darin, daß mit relativ einfachen Maßnahmen zumindest während des Betriebs eine Pegelkorrektur dahingehend vorgenommen werden kann, daß der Zuhörer zumindest im Hinblick auf die von ihm wahrgenommene Lautstärke einer virtuellen Quelle nichts davon merkt, daß nicht die eigentlich erforderlichen unendlich vielen Lautsprecher vorhanden sind, sondern lediglich eine begrenzte Menge an Lautsprechern.
Ein weiterer Vorteil besteht darin, daß auch dann, wenn sich eine virtuelle Quelle in einem bezüglich des Zuschauers gleichbleibenden Abstand (z. B. von links nach rechts) bewegt, diese Quelle für den Zuschauer, der beispielsweise in der Mitte vor der Leinwand sitzt, immer gleich laut ist und nicht einmal lauter und einmal leiser ist, was ohne Korrektur der Fall sein würde.
Ein weiterer Vorteil besteht darin, daß sie die Option dahingehend liefert, preisgünstigere Wellenfeldsynthesesysteme mit einer geringeren Anzahl von Lautsprechern anzubieten, die dennoch insbesondere bei sich bewegenden Quellen keine Pegelartefakte mit sich bringen, also für einen Zuhörer im Hinblick auf die Pegelproblematik genau so gut wirken wie aufwendigere Wellenfeldsynthesesysteme mit einer hohen Anzahl an Lautsprechern. Auch für Löcher im Array können eventuell zu niedrige Pegel erfindungsgemäß korrigiert werden.
Bevor detailliert auf die vorstehend beschriebene bevorzugte Art und Weise zur Pegelartefaktkorrektur eingegangen wird, sei zunächst anhand von Fig. 9 das erfindungsgemäße Konzept zum Erzeugen eines Tieftonkanals dargestellt, das entweder für sich stehend, also ohne Pegelkorrektur der Einzellautsprecher eingesetzt werden kann, oder das vorzugsweise mit dem später Bezug nehmend auf die Fig. 1 - 8 beschriebenen Konzept der Pegelartefaktkorrektur kombiniert werden kann, um die zur Pegelartefaktkorrektur der Einzellautsprecher verwendeten Korrekturwerte auch als Audioobjektskalierungswerte zu verwenden, die bei der Tieftonkanalerzeugung eingesetzt werden müssen.
Fig. 9 zeigt eine Vorrichtung zum Erzeugen eines Tieftonkanals für einen Tieftonlautsprecher, der an einer vorbestimmten Lautsprecherposition angeordnet ist. Die in Fig. 9 gezeigte Vorrichtung umfaßt zunächst eine Einrichtung 900 zum Bereitstellen einer Mehrzahl von Audioobjekten, wobei einem Audioobjekt ein Audioobjektsignal 902 sowie eine Audioobjektbeschreibung 904 zugeordnet sind. Die Audioobjektbeschreibung wird typischerweise eine Audioobjektposition und möglicherweise auch die Audioobjektart umfassen. Je nach Ausführungsform kann die Audioobjektbeschreibung auch direkt eine Angabe für die Audioobjektlautstärke umfassen. Ist dies nicht der Fall, so ist die Audioobjektlautstärke ohne weiteres aus dem Audioobjektsignal selbst zu berechnen, beispielsweise durch abtastwertweise Quadrierung und Aufsummation über einen bestimmten Zeitraum. Sollen bereits hier Übertragungsfunktion, Frequenzgang etc. der einzelnen betrachteten Lautsprecher oder auch des Tieftonlautsprechers berücksichtigt werden, so wird dies ebenfalls durch einen einfachen Tabellennachschlag bzw. einen Korrekturfaktor realisierbar sein, da in einem Wiedergabesystem das elektrische Verhalten des Lautsprechers bzw. die Signal-/Schallcharakteristik des Lautsprechers eine stationäre Größe ist.
Die Objektbeschreibung des Audiosignals wird einer Einrichtung 906 zum Berechnen eines Audioobjektskalierungswerts für jedes Audioobjekt zugeführt. Die einzelnen Audioobjektskalierungswerte 908 werden dann, wie es anhand von Fig. 9 gezeigt ist, einer Einrichtung 910 zum Skalieren der Objektsignale zugeführt. Die Einrichtung 906 zum Berechnen der Audioobjektskalierungswerte ist ausgebildet, um für jedes Audioobjekt abhängig von der Objektbeschreibung einen Audioobjektskalierungswert zu berechnen. Handelt es sich um eine Quelle, die ebene Wellen aussendet, so wird der Audioobjektskalierungswert bzw. der Korrekturfaktor gleich 1 sein, da für solche Ebene-Wellen-Audioobjekte eine Beabstandung zwischen der Position dieses Objekts und der optimalen Referenzwiedergabeposition unerheblich ist, da die virtuelle Position in diesem Fall im Unendlichen angenommen wird.
Handelt es sich bei dem Audioobjekt dagegen um eine punktförmig abstrahlende virtuelle Quelle, die an einer virtuellen Position positioniert ist, so wird der Audioobjektskalierungswert abhängig von der Objektlautstärke, die sich entweder in der Objektbeschreibung befindet oder vom Objektsignal abzuleiten ist, und dem Abstand zwischen der virtuellen Position des Audioobjekts und der Referenzwiedergabeposition berechnet.
Insbesondere wird es bevorzugt, den Audioobjektskalierungswert bzw. Korrekturwert derart zu berechnen, daß berücksichtigt wird, daß derselbe auf einem Soll-Amplitudenzustand in dem Vorführbereich basiert, wobei der Soll-Amplitudenzustand von einer Position der virtuellen Quelle oder einer Art der virtuellen Quelle abhängt, wobei der Korrekturwert ferner auf einem Ist-Amplitudenzustand in dem Vorführbereich basiert, der auf den Komponentensignalen für die Einzellautsprecher aufgrund der betrachteten virtuellen Quelle basiert. Der Korrekturwert wird also so berechnet, daß durch eine Manipulation des der virtuellen Quelle zugeordneten Audiosignals unter Verwendung des Korrekturwerts eine Abweichung zwischen dem Soll-Amplitudenzustand und dem Ist-Amplitudenzustand verkleinert wird. Nach Skalierung der Objektsignale, die durch die Einrichtung 910 durchgeführt wird, um die skalierten Objektsignale 912 zu erhalten, werden dieselben einer Einrichtung 914 zum Summieren zugeführt, um ein Summensignal 916 zu erzeugen.
Wie es ausgeführt worden ist, wird bevorzugt, vor der Summation durch die Einrichtung 914 auch eine eventuell durch unterschiedliche virtuelle Positionen bedingte Verzögerung bzw. Delay zu berücksichtigen, so daß die einzelnen Audioobjektsignale, die als Sequenzen von Abtastwerten vorliegen, bezüglich einer Zeitreferenz verschoben werden, um Laufzeitunterschiede des Schallsignals von der virtuellen Position zur Referenzwiedergabeposition ausreichend zu berücksichtigen. Nach Skalierung und Berücksichtigung der Verzögerung werden dann die skalierten und entsprechend verzögerten Objektsignale durch die Einrichtung 914 abtastwertweise aufsummiert, um ein Summensignal mit einer Sequenz von Summensignalabtastwerten zu erhalten, das in Fig. 9 mit 916 bezeichnet ist. Dieses Summensignal 916 wird einer Einrichtung 918 zum Bereitstellen des Tieftonkanals für den einen bzw. die mehreren Subwoofer zugeführt, welche ausgangsseitig das Subwoofersignal bzw. den Tieftonkanal 920 liefert.
Wie es ausgeführt worden ist, ist das durch einen Tieftonlautsprecher ausgesendete Schallsignal kein Schallsignal mit voller Bandbreite, sondern mit nach oben begrenzter Bandbreite. In einer Ausführungsform wird bevorzugt, daß die Grenzfrequenz des von einem Tieftonlautsprecher ausgesendeten Schallsignals kleiner als 250 Hz ist und vorzugsweise sogar bei lediglich 125 Hz liegt. Die Bandbegrenzung dieses Schallsignals kann an verschiedenen Stellen erfolgen. Eine einfache Maßnahme besteht darin, dem Tieftonlautsprecher ein Anregungssignal mit voller Bandbreite zuzuführen, das dann durch den Tieftonlautsprecher selbst bandbegrenzt wird, da derselbe lediglich tiefe Frequenzen in Schallsignale umsetzt, jedoch hohe Frequenzen unterdrückt.
Alternativ kann die Bandbegrenzung jedoch auch in der Einrichtung 918 zum Bereitstellen des Tieftonkanals erfolgen, indem das Signal dort vor einer Digital-/Analogwandlung tiefpaßgefiltert wird, wobei diese Tiefpaßfilterung, da sie auf digitaler Seite durchgeführt werden kann, bevorzugt wird, damit klare Verhältnisse unabhängig von der tatsächlichen Implementierung des Subwoofers existieren. Alternativ kann jedoch die Tiefpaßfilterung bereits vor der Einrichtung 910 zum Skalieren der Objektsignale erfolgen, so daß die Operationen, die durch die Einrichtungen 910, 914, 918 ausgeführt werden, nunmehr mit Tiefpaßsignalen und nicht mit Signalen der gesamten Bandbreite durchgeführt werden.
Erfindungsgemäß wird es jedoch bevorzugt, die Tiefpaßfilterung in der Einrichtung 918 durchzuführen, so daß die Berechnung der Audioobjektskalierungswerte, die Skalierung der Objektsignale und die Summation mit Signalen voller Bandbreite durchgeführt wird, um eine möglichst gute Übereinstimmung der Lautsprecher zwischen Tiefton einerseits und Mittelton und Hochton andererseits sicherzustellen. In anderen Worten ausgedrückt wird es bevorzugt, möglichst viele Operationen parallel zur Bestimmung der eigentlichen Lautsprechersignale für die Lautsprecher im Wellenfeldsynthesearray durchzuführen und erst sehr spät eine "Abspaltung" des Tieftonkanals durchzuführen.
Fig. 10 zeigt eine bevorzugte Ausführungsform der Einrichtung 918 zum Bereitstellen von nunmehr mehreren Tieftonkanälen für mehrere Subwoofer. Bevor detailliert auf Fig. 10 eingegangen wird, sei zunächst anhand von Fig. 11 die geometrische Situation dargestellt. In Fig. 11 ist schematisch ein Wellenfeldsynthesesystem mit einer Vielzahl von Einzellautsprechern 808 dargestellt. Die Einzellautsprecher 808 bilden ein Array 800 von Einzellautsprechern, die den Vorführbereich umschließen. Vorzugsweise innerhalb des Vorführbereichs befindet sich die Referenzwiedergabeposition bzw. der Referenzpunkt 1100.
In Fig. 11 ist ferner schematisch ein Audioobjekt 1102, das als "virtuelles Klangobjekt" bezeichnet ist. Das virtuelle Klangobjekt 1102 umfaßt eine Objektbeschreibung, die eine virtuelle Position 1104 darstellt. Anhand der Koordinaten des Referenzpunkts 1100 und der Koordinaten der virtuellen Position 1104, die gegebenenfalls entsprechend umrechenbar sind, ist der Abstand D des virtuellen Klangobjekts 1102 von der Referenzwiedergabeposition 100 bestimmbar. Anhand dieses Abstands D kann bereits eine einfache Audioobjektskalierungswertberechnung durchgeführt werden, nämlich anhand der Gesetzmäßigkeit, die in Fig. 7a später noch detailliert erklärt werden wird. Fig. 11 zeigt ferner einen ersten Tieftonlautsprecher 1106 an einer ersten vorbestimmten Lautsprecherposition 1108 sowie einen zweiten Tieftonlautsprecher 1110 an einer zweiten Tieftonlautsprecherposition 1112. Wie es in Fig. 11 ausgeführt ist, ist der zweite Subwoofer 1110 bzw. jeder weitere in Fig. 11 nicht dargestellte zusätzliche Subwoofer optional. Der erste Subwoofer 1106 hat zum Referenzpunkt 1100 einen Abstand d1, während der zweite Subwoofer 1110 zum Referenzpunkt einen Abstand d2 hat. Analog hierzu hat ein Subwoofer n (in Fig. 11 nicht gezeigt) zum Referenzpunkt 1100 einen Abstand dn.
Wieder Bezug nehmend auf Fig. 10 ist die Einrichtung 918 zum Bereitstellen des Tieftonkanals ausgebildet, um neben dem Summensignal 916, das in Fig. 10 mit s bezeichnet ist, auch den Abstand d1 des Tieftonlautsprechers 1, der mit 930 bezeichnet ist, auf den Abstand d2 des Tieftonlautsprechers 2, der mit 932 bezeichnet ist, sowie den Abstand dn des Tieftonlautsprechers n, der mit 934 bezeichnet ist, zu empfangen. Ausgangsseitig liefert die Einrichtung 918 einen ersten Tieftonkanal 940, einen zweiten Tieftonkanal 942 sowie einen n-ten Tieftonkanal 944. Aus Fig. 10 ist ersichtlich, daß sämtliche Tieftonkanäle 940, 942, 944 gewichtete Versionen des Summensignals 916 sind, wobei die jeweiligen Gewichtungsfaktoren mit a₁, a₂, ..., a_n bezeichnet sind. Die einzelnen Gewichtungsfaktoren a₁, a₂, a_n hängen einerseits von den Abständen 930 - 934 sowie andererseits von der allgemeinen Randbedingung ab, daß die Lautstärke der Tieftonkanäle am Referenzpunkt 100 gleich der Referenzlautstärke, also dem Soll-Amplitudenzustand für den Tieftonkanal an der Referenzwiedergabeposition 1100 (Fig. 11) entspricht. Nachdem sich sämtliche Subwoofer vom Referenzpunkt 1100 entfernt befinden, wird die Summe der Lautsprecherskalierungswerte a₁, a₂, a_n größer als 1 sein, um die Dämpfung der Tieftonkanäle auf dem Weg vom entsprechenden Subwoofer zum Referenzpunkt entsprechend zu berücksichtigen. Falls nur ein einziger Tieftonlautsprecher (z. B. 1106) vorgesehen ist, wird der Skalierungsfaktor a₁ ebenfalls größer als 1 sein, während keine weiteren Skalierungsfaktoren zu berechnen sind, da nur ein einziger Tieftonlautsprecher vorhanden ist.
Nachfolgend wird Bezug nehmend auf die Fig. 1 - 8 eine Pegelartefaktkorrekturvorrichtung für das Lautsprecherarray 800 in Fig. 8 bzw. Fig. 11 dargestellt, die mit der erfindungsgemäßen Tieftonkanalberechnung, wie sie anhand der Fig. 9 - 11 dargestellt worden ist, vorzugsweise kombiniert werden kann.
Bevor detailliert auf die vorliegende Erfindung eingegangen wird, wird nachfolgend anhand von Fig. 8 der prinzipielle Aufbau eines Wellenfeldsynthesesystems dargestellt. Das Wellenfeldsynthesesystem hat ein Lautsprecherarray 800, das bezüglich eines Vorführbereichs 802 plaziert ist. Im einzelnen umfaßt das in Fig. 8 gezeigte Lautsprecherarray, das ein 360°-Array ist, vier Arrayseiten 800a, 800b, 800c und 800d. Ist der Vorführbereich 802 z. B. ein Kinosaal, so wird bezüglich der Konventionen vorne/hinten oder rechts/links davon ausgegangen, daß sich die Kinoleinwand auf derselben Seite des Vorführbereichs 802 befindet, an der auch das Teil-Array 800c angeordnet ist. In diesem Fall würde der Betrachter, der an dem hier so genannten Optimal-Punkt P in dem Vorführbereich 802 sitzt, nach vorne, also auf die Leinwand, sehen. Hinter dem Zuschauer würde sich dann das Teil-Array 800a befinden, während sich links vom Zuschauer das Teil-Array 800d befinden würde, und während sich rechts vom Zuschauer das Teil-Array 800b befinden würde. Jedes Lautsprecherarray besteht aus einer Anzahl von verschiedenen Einzellautsprechern 808, die jeweils mit eigenen Lautsprechersignalen angesteuert werden, die von einem Wellenfeldsynthesemodul 810 über einen in Fig. 8 lediglich schematisch gezeigten Datenbus 812 bereitgestellt werden. Das Wellenfeldsynthesemodul ist ausgebildet, um unter Verwendung der Informationen über z. B. Art und Lage der Lautsprecher bezüglich des Vorführbereichs 802, also von Lautsprecher-Informationen (LS-Infos), und gegebenenfalls mit sonstigen Inputs Lautsprechersignale für die einzelnen Lautsprecher 808 zu berechnen, die jeweils von den Audiotracks für virtuelle Quellen, denen ferner Positionsinformationen zugeordnet sind, gemäß den bekannten Wellenfeldsynthesealgorithmen abgeleitet werden. Das Wellenfeldsynthesemodul kann ferner noch weitere Eingaben erhalten, wie beispielsweise Informationen über die Raumakustik des Vorführbereichs etc.
Die nachfolgenden Ausführungen zur vorliegenden Erfindung können prinzipiell für jeden Punkt P in dem Vorführbereich durchgeführt werden. Der Optimal-Punkt kann somit an jeder beliebigen Stelle im Vorführbereich 802 liegen. Es kann auch mehrere Optimal-Punkte, z. B. auf einer Optimal-Linie, geben. Um jedoch möglichst gute Verhältnisse für möglichst viele Punkte im Vorführbereich 802 zu erhalten, wird es bevorzugt, den Optimal-Punkt bzw. die Optimal-Linie in der Mitte bzw. am Schwerpunkt des Wellenfeldsynthesesystems, das durch die Lautsprecher-Teilarrays 800a, 800b, 800c, 800d definiert ist, anzunehmen.
Eine detailliertere Darstellung des Wellenfeldsynthesemoduls 800 wird nachfolgend anhand der Fig. 2 und 3 Bezug nehmend auf das Wellenfeldsynthesemodul 200 in Fig. 2 bzw. auf die in Fig. 3 detailliert dargestellte Anordnung gegeben.
Fig. 2 zeigt eine Wellenfeldsyntheseumgebung, in der die vorliegende Erfindung implementiert werden kann. Zentrum einer Wellenfeldsyntheseumgebung ist ein Wellenfeldsynthesemodul 200, das diverse Eingänge 202, 204, 206 und 208 sowie diverse Ausgänge 210, 212, 214, 216 umfaßt. Über Eingänge 202 bis 204 werden dem Wellenfeldsynthesemodul verschieden Audiosignale für virtuelle Quellen zugeführt. So empfängt der Eingang 202 z. B. ein Audiosignal der virtuellen Quelle 1 sowie zugeordnete Positionsinformationen der virtuellen Quelle. In einem Kinosetting beispielsweise wäre das Audiosignal 1 z. B. die Sprache eines Schauspielers, der sich von einer linken Seite der Leinwand zu einer rechten Seite der Leinwand und möglicherweise zusätzlich noch vom Zuschauer weg bzw. zum Zuschauer hin bewegt. Das Audiosignal 1 wäre dann die tatsächliche Sprache dieses Schauspielers, während die Positionsinformationen als Funktion der Zeit die zu einem bestimmten Zeitpunkt aktuelle Position des ersten Schauspielers im Aufnahmesetting darstellt. Dagegen wäre das Audiosignal n die Sprache beispielsweise eines weiteren Schauspielers, der sich gleich oder anders als der erste Schauspieler bewegt. Die aktuelle Position des anderen Schauspielers, dem das Audiosignal n zugeordnet ist, wird durch mit dem Audiosignal n synchronisierte Positionsinformationen dem Wellenfeldsynthesemodul 200 mitgeteilt. In der Praxis existieren verschiedene virtuelle Quellen je nach Aufnahmesetting, wobei das Audiosignal jeder virtuellen Quelle als eigener Audiotrack dem Wellenfeldsynthesemodul 200 zugeführt wird.
Wie es vorstehend dargelegt worden ist, speist ein Wellenfeldsynthesemodul eine Vielzahl von Lautsprechern LS1, LS2, LS3, LSm durch Ausgabe von Lautsprechersignalen über die Ausgänge 210 bis 216 zu den einzelnen Lautsprechern. Dem Wellenfeldsynthesemodul 200 werden über den Eingang 206 die Positionen der einzelnen Lautsprecher in einem Wiedergabesetting, wie beispielsweise einem Kinosaal mitgeteilt. Im Kinosaal befinden sich um den Kinozuschauer herum gruppiert viele einzelne Lautsprecher, die in Arrays vorzugsweise derart angeordnet sind, daß sich sowohl vor dem Zuschauer, also beispielsweise hinter der Leinwand, als auch hinter dem Zuschauer sowie rechts und links des Zuschauers Lautsprecher befinden. Ferner können dem Wellenfeldsynthesemodul 200 noch sonstige Eingaben mitgeteilt werden, wie beispielsweise Informationen über die Raumakustik etc., um in einem Kinosaal die tatsächliche während des Aufnahmesettings herrschende Raumakustik simulieren zu können.
Allgemein gesagt wird das Lautsprechersignal, das beispielsweise dem Lautsprecher LS1 über den Ausgang 210 zugeführt wird, eine Überlagerung von Komponentensignalen der virtuellen Quellen sein, dahingehend, daß das Lautsprechersignal für den Lautsprecher LS1 eine erste Komponente, die auf die virtuelle Quelle 1 zurückgeht, eine zweite Komponente, die auf die virtuelle Quelle 2 zurückgeht, sowie eine n-te Komponente, die auf die virtuelle Quelle n zurückgeht, umfassen. Die einzelnen Komponentensignale werden linear superponiert, also nach ihrer Berechnung addiert, um die linerare Superposition am Ohr des Zuhörers nachzubilden, der in einem realen Setting eine lineare Überlagerung der von ihm wahrnehmbaren Schallquellen hören wird.
Nachfolgend wird Bezug nehmend auf Fig. 3 eine detailliertere Ausgestaltung des Wellenfeldsynthesemoduls 200 dargelegt. Das Wellenfeldsynthesemodul 200 hat einen stark parallelen Aufbau dahingehend, daß ausgehend von dem Audiosignal für jede virtuelle Quelle und ausgehend von den Positionsinformationen für die entsprechende virtuelle Quelle zunächst Verzögerungsinformationen V_i sowie Skalierungsfaktoren SF_i berechnet werden, die von den Positionsinformationen und der Position des gerade betrachteten Lautsprechers, z. B. dem Lautsprecher mit der Ordnungsnummer j, also LSj, abhängen. Die Berechnung einer Verzögerungsinformation V_i sowie eines Skalierungsfaktors SF_i aufgrund der Positionsinformationen einer virtuellen Quelle und der Lage des betrachteten Lautsprechers j geschieht durch bekannte Algorithmen, die in Einrichtungen 300, 302, 304, 306 implementiert sind. Auf der Basis der Verzögerungsinformationen V_i(t) und SF_i(t) sowie auf der Basis des der einzelnen virtuellen Quelle zugeordneten Audiosignals AS_i(t) wird für einen aktuellen Zeitpunkt t_A ein diskreter Wert AW_i(t_A) für das Komponentensignal K_ij in einem letztendlich erhaltenen Lautsprechersignal berechnet. Dies erfolgt durch Einrichtungen, 310, 312, 314, 316, wie sie in Fig. 3 schematisch dargestellt sind. Fig. 3 zeigt ferner gewissermaßen eine "Blitzlichtaufnahme" zum Zeitpunkt t_A für die einzelnen Komponentensignale. Die einzelnen Komponentensignale werden dann durch einen Summierer 320 summiert, um den diskreten Wert für den aktuellen Zeitpunkt t_A des Lautsprechersignals für den Lautsprecher j zu ermitteln, der dann für den Ausgang (beispielsweise der Ausgang 214, wenn der Lautsprecher j der Lautsprecher LS3 ist), dem Lautsprecher zugeführt werden kann.
Wie es aus Fig. 3 ersichtlich ist, wird zunächst für jede virtuelle Quelle einzeln ein aufgrund einer Verzögerung und einer Skalierung mit einem Skalierungsfaktor zu einem aktuellen Zeitpunkt gültiger Wert berechnet, wonach sämtliche Komponentensignale für einen Lautsprecher aufgrund der verschiedenen virtuellen Quellen summiert werden. Wäre beispielsweise nur eine virtuelle Quelle vorhanden, so würde der Summierer entfallen, und das am Ausgang des Summierers in Fig. 3 anliegende Signal würde z. B. dem Signal entsprechen, das von der Einrichtung 310 ausgegeben wird, wenn die virtuelle Quelle 1 die einzige virtuelle Quelle ist.
An dieser Stelle sei darauf hingewiesen, daß an dem Ausgang 322 von Fig. 3 der Wert eines Lautsprechersignals erhalten wird, das eine Überlagerung der Komponentensignale für diesen Lautsprecher aufgrund der verschiedenen virtuellen Quellen 1, 2, 3, ..., n ist. Eine Anordnung, wie sie in Fig. 3 gezeigt ist, wäre prinzipiell für jeden Lautsprecher 808 im Wellenfeldsynthesemodul 810 vorgesehen, es sei denn, daß, was aus praktischen Gründen bevorzugt wird, immer z. B. 2, 4 oder 8 zusammenliegende Lautsprecher mit demselben Lautsprechersignal angesteuert werden.
Fig. 1 zeigt ein Blockschaltbild der erfindungsgemäßen Vorrichtung zum Pegel-Korrigieren in einem Wellenfeldsynthesesystem, das Bezug nehmend auf Fig. 8 dargelegt worden ist. Das Wellenfeldsynthesesystem umfaßt das Wellenfeldsynthesemodul 810 sowie das Lautsprecherarray 800 zur Schallversorgung des Vorführbereichs 802, wobei das Wellenfeldsynthesemodul 810 ausgebildet ist, um ein einer virtuellen Schallquelle zugeordnetes Audiosignal sowie der virtuellen Schallquelle zugeordnete Quellenpositionsinformationen zu empfangen und unter Berücksichtigung von LautsprecherPositionsinformationen Komponentensignale für die Lautsprecher aufgrund der virtuellen Quelle zu berechnen. Die erfindungsgemäße Vorrichtung umfaßt zunächst eine Einrichtung 100 zum Ermitteln eines Korrekturwerts, der auf einem Soll-Amplitudenzustand in dem Vorführbereich basiert, wobei der Soll-Amplitudenzustand von einer Position der virtuellen Quelle oder einer Art der virtuellen Quelle abhängt, und wobei der Korrekturwert ferner auf einem Ist-Amplitudenzustand in dem Vorführbereich basiert, der von den Komponentensignalen für die Lautsprecher aufgrund der virtuellen Quelle abhängt.
Die Einrichtung 100 hat einen Eingang 102 zum Erhalten einer Position der virtuellen Quelle, wenn sie z. B. eine Punktquellencharakteristik hat, oder zum Erhalten von Informationen über eine Art der Quelle, wenn die Quelle z. B. eine Quelle zur Erzeugung von ebenen Wellen ist. In diesem Fall ist der Abstand des Zuhörers von der Quelle zur Bestimmung des Ist-Zustands nicht nötig, da sich die Quelle aufgrund der erzeugten ebenen Wellen im Modell gedacht ohnehin unendlich weit entfernt von dem Hörer befindet und einen positionsunabhängigen Pegel hat. Die Einrichtung 100 ist ausgebildet, um ausgangsseitig einen Korrekturwert 104 auszugeben, der einer Einrichtung 106 zum Manipulieren eines der virtuellen Quelle zugeordneten Audiosignals (das über einen Eingang 108 erhalten wird) oder zum Manipulieren von Komponentensignalen für die Lautsprecher aufgrund einer virtuellen Quelle (die über einen Eingang 110 erhalten werden), zu manipulieren. Falls die Alternative des Manipulierens des Audiosignals, das über den Eingang 108 bereitgestellt wird, durchgeführt wird, ergibt sich an einem Ausgang 112 ein manipuliertes Audiosignal, das dann erfindungsgemäß statt des ursprünglichen Audiosignals, das am Eingang 108 bereitgestellt wird, in das Wellenfeldsynthesemodul 200 eingespeist wird, um die einzelnen Lautsprechersignale 210, 212, ..., 216 zu erzeugen.
Wurde dagegen die andere Alternative zum Manipulieren verwendet, nämlich die gewissermaßen eingebettete Manipulation der Komponentensignale, die über den Eingang 110 erhalten worden sind, so werden ausgangsseitig manipulierte Komponentensignale erhalten, die noch Lautsprecher-weise aufsummiert werden müssen (Einrichtung 116), und zwar mit gegebenenfalls manipulierten Komponentensignalen von anderen virtuellen Quellen, die über weitere Eingänge 118 bereitgestellt werden. Ausgangsseitig liefert die Einrichtung 116 wieder die Lautsprechersignale 210, 212, ..., 216. Es sei darauf hingewiesen, daß die in Fig. 1 gezeigten Alternativen der vorgeschalteten Manipulation (Ausgang 112) oder der eingebetteten Manipulation (Ausgang 114) alternativ zueinander verwendet werden können. Je nach Ausführungsform kann es jedoch auch Fälle geben, in denen der Gewichtungsfaktor bzw. Korrekturwert, der über den Eingang 104 in die Einrichtung 106 bereitgestellt wird, gewissermaßen gesplittet wird, so daß teilweise eine vorgeschaltete Manipulation und teilweise eine eingebettete Manipulation durchgeführt wird.
Im Hinblick auf Fig. 3 würde die vorgeschaltete Manipulation somit darin bestehen, daß das Audiosignal der virtuellen Quelle, das in eine Einrichtung 310, 312, 314 bzw. 316 eingespeist wird, vor seiner Einspeisung manipuliert wird.
Die eingebettete Manipulation würde dagegen darin bestehen, daß die von den Einrichtungen 310, 312, 314 bzw. 316 ausgegebenen Komponentensignale vor ihrer Summation, um tatsächliche Lautsprechersignal zu erhalten, manipuliert werden.
Diese beiden Möglichkeiten, die entweder alternativ oder kumulativ verwendbar sind, sind in den Fig. 6a und Fig. 6b dargestellt. So zeigt Fig. 6a die eingebettete Manipulation durch die Manipulationseinrichtung 106, die in Fig. 6a als Multiplizierer gezeichnet ist. Eine Wellenfeldsyntheseeinrichtung, die beispielsweise aus den Blöcken 300, 310 bzw. 302, 312, bzw. 304, 314 und 306 bzw. 316 von Fig. 3 besteht, liefert die Komponentensignale K₁₁, K₁₂, K₁₃ für den Lautsprecher LS1 bzw. die Komponentensignale K_n1, K_n2 und K_n3 für den Lautsprecher LSn.
In der in Fig. 6a gewählten Notation zeigt der erste Index von K_ij den Lautsprecher an, und zeigt der zweite Index die virtuelle Quelle an, von der das Komponentensignal stammt. Die virtuelle Quelle 1 beispielsweise äußert sich in dem Komponentensignal K_l1, ..., K_nl. Um den Pegel der virtuellen Quelle 1 abhängig von den Positionsinformationen der virtuellen Quelle 1 (ohne Beeinflussung der Pegel der anderen virtuellen Quellen) selektiv zu beeinflussen, wird bei der in Fig. 6a gezeigten eingebetteten Manipulation eine Multiplikation der Komponentensignale, die zu der Quelle 1 gehören, also der Komponentensignale, deren Index j auf die virtuelle Quelle 1 hinweist, mit dem Korrekturfaktor F₁ stattfinden. Um eine entsprechende Amplituden- bzw. Pegelkorrektur für die virtuelle Quelle 2 durchzuführen, werden sämtliche Komponentensignale, die auf die virtuelle Quelle 2 zurückgehen, mit einem hierfür bestimmten Korrekturfaktor F₂ multipliziert. Schließlich werden auch die Komponentensignale, die auf die virtuelle Quelle 3 zurückgehen, durch einen entsprechenden Korrekturfaktor F₃ gewichtet.
Es sei darauf hingewiesen, daß die Korrekturfaktoren F₁, F₂ und F₃, wenn alle sonstigen geometrischen Parameter gleich sind, lediglich von der Position der entsprechenden virtuellen Quelle abhängen. Würden somit alle drei virtuellen Quellen z. B. Punktquellen (also gleicher Art) sein und an derselben Position sein, so wäre die Korrekturfaktoren für die Quellen identisch. Diese Gesetzmäßigkeit wird noch Bezug nehmend auf Fig. 4 näher erläutert, da es zur Rechenzeitvereinfachung möglich ist, eine Nachschlagtabelle mit Positionsinformationen und jeweils zugeordneten Korrekturfaktoren zu verwenden, die zwar irgendwann erstellt werden muß, auf die jedoch im Betrieb schnell zugegriffen werden kann, ohne daß im Betrieb ständig eine Sollwert/Istwert-Berechnungs- und Vergleichs-Operation durchgeführt werden muß, was jedoch prinzipiell ebenfalls möglich ist.
Fig. 6b zeigt die erfindungsgemäße Alternative zur Quellenmanipulation. Die Manipulationseinrichtung ist hier der Wellenfeldsyntheseeinrichtung vorgeschaltet und ist wirksam, um die Audiosignale der Quellen mit den entsprechenden Korrekturfaktoren zu korrigieren, um manipulierte Audiosignale für die virtuellen Quellen zu erhalten, die dann der Wellenfeldsyntheseeinrichtung zugeführt werden, um die Komponentensignale zu erhalten, die dann von den jeweiligen Komponentensummationseinrichtungen aufsummiert werden, um die Lautsprechersignale LS für die entsprechenden Lautsprecher, wie beispielsweise den Lautsprecher LS_i, zu erhalten.
Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung ist die Einrichtung 100 zum Ermitteln des Korrekturwerts als Nachschlagtabelle 400 ausgebildet, die Position-Korrekturfaktor-Wertepaare speichert. Die Einrichtung 100 ist vorzugsweise ferner mit einer Interpolationseinrichtung 402 versehen, um einerseits die Tabellengröße der Nachschlagtabelle 400 in einem begrenzten Rahmen zu halten, und um andererseits auch für aktuelle Positionen einer virtuellen Quelle, die über einen Eingang 404 in die Interpolationseinrichtung eingespeist werden, zumindest unter Verwendung einer oder mehrerer benachbarter in der Nachschlagtabelle gespeicherten Position-Korrekturfaktor-Wertepaare, die der Interpolationseinrichtung 402 über eine Eingang 406 zugeführt werden, einen interpolierten aktuellen Korrekturfaktor an einem Ausgang 408 zu erzeugen. Bei einer einfacheren Version kann die Interpolationseinrichtung 402 jedoch auch weggelassen werden, so daß die Einrichtung 100 zum Ermitteln von Fig. 1 einen direkten Zugriff unter Verwendung von an einem Eingang 410 zugeführten Positionsinformationen auf die Nachschlagtabelle durchführt und an einem Ausgang 412 einen entsprechenden Korrekturfaktor liefert. Entsprechen die aktuellen Positionsinformationen, die dem Audiotrack der virtuellen Quelle zugeordnet sind, nicht genau einer Positionsinformation, die in der Nachschlagtabelle zu finden ist, so kann der Nachschlagtabelle noch eine einfache Abrundungs-/Aufrundungs-Funktion zugeordnet sein, um den nächstliegenden in der Tabelle gespeicherten Stützwert statt des aktuellen Stützwerts zu nehmen.
An dieser Stelle sei darauf hingewiesen, dass für verschiedene Quellenarten verschiedene Tabellen angelegt werden können, oder dass einer Position nicht nur ein Korrekturfaktor zugeordnet ist, sondern mehrere Korrekturfaktoren, wobei jeder Korrekturfaktor mit einer Quellenart verknüpft ist.
Alternativ kann statt der Nachschlagtabelle oder zur "Auffüllung" der Nachschlagtabelle in Fig. 4 die Einrichtung zum Ermitteln ausgebildet sein, um tatsächlich einen Sollwert-Istwert-Vergleich durchzuführen. In diesem Fall umfaßt die Einrichtung 100 von Fig. 1 eine Soll-Amplituden-Zustandsermittlungseinrichtung 500 sowie eine Ist-Amplituden-Zustandsermittlungseinrichtung 502, um einen Soll-Amplitudenzustand 504 sowie einen Ist-Amplitudenzustand 506 zu liefern, die einer Vergleichseinrichtung 508 zugeführt werden, die beispielsweise einen Quotienten aus dem Soll-Amplitudenzustand 504 und dem Ist-Amplitudenzustand 506 berechnet, um einen Korrekturfaktor 510 zu erzeugen, der der Einrichtung 106 zum Manipulieren, die in Fig. 1 gezeigt ist, zur weiteren Verwendung zugeführt wird. Alternativ kann der Korrekturwert auch in einer Nachschlagtabelle abgespeichert werden.
Die Soll-Amplituden-Zustandsberechnung ist ausgebildet, um einen Soll-Pegel am Optimal-Punkt für eine an einer bestimmten Position bzw. in einer bestimmten Art ausgestaltete virtuelle Quelle zu ermitteln. Für die Soll-Amplitudenzustandsberechnung benötigt die Soll-Amplitudenzustandsermittlungseinrichtung 500 selbstverständliche keine Komponentensignale, da der Soll-Amplitudenzustand von den Komponentensignalen unabhängig ist. Komponentensignale werden jedoch, wie es aus Fig. 5 ersichtlich ist, der Ist-Amplitudenermittlungseinrichtung 502 zugeführt, die ferner je nach Ausführungsform auch noch Informationen über die Lautsprecherpositionen sowie Informationen über Lautsprecher-Übertragungsfunktionen und/oder Informationen über Richtcharakteristika der Lautsprecher erhalten kann, um eine Ist-Situation so gut als möglich zu ermitteln. Alternativ kann die Ist-Amplitudenzustandsermittlungseinrichtung 502 auch als tatsächliches Meßsystem ausgebildet sein, um eine Ist-Pegelsituation an dem Optimal-Punkt für bestimmte virtuelle Quellen an bestimmten Positionen zu ermitteln.
Nachfolgend wird Bezug nehmend auf Fig. 7a und Fig. 7b auf den Ist-Amplitudenzustand bzw. den Soll-Amplitudenzustand Bezug genommen. Fig. 7a zeigt ein Diagramm zum Ermitteln eines Soll-Amplitudenzustands an einem vorbestimmten Punkt, der in Fig. 7a mit "Optimal-Punkt" bezeichnet ist, und der im Vorführbereich 802 von Fig. 8 liegt. In Fig. 7a ist lediglich beispielhaft eine virtuelle Quelle 700 als Punktquelle eingezeichnet, die ein Schallfeld mit konzentrischen Wellenfronten erzeugt. Ferner ist aufgrund des Audiosignals für die virtuelle Quelle 700 der Pegel L_v der virtuellen Quelle 700 bekannt. Der Soll-Amplitudenzustand bzw. dann, wenn der Amplitudenzustand ein Pegelzustand ist, der Soll-Pegel an dem Punkt P im Vorführbereich wird ohne weiteres dadurch erhalten, daß der Pegel L_P am Punkt P gleich dem Quotienten aus L_v und einem Abstand r ist, den der Punkt P zu der virtuellen Quelle 700 hat. Der Soll-Amplitudenzustand kann somit ohne weiteres durch Berechnung des Pegels L_v der virtuellen Quelle und durch Berechnung des Abstands r vom Optimal-Punkt zur virtuellen Quelle ermittelt werden. Zur Berechnung des Abstands r muß typischerweise eine Koordinatentransformation der virtuellen Koordinaten in die Koordinaten des Vorführraums oder eine Koordinatentransformation der Vorführraumkoordinaten des Punkts P in die virtuellen Koordinaten durchgeführt werden, was für Fachleute auf dem Gebiet der Wellenfeldsynthese bekannt ist.
Ist die virtuellen Quelle dagegen eine unendlich weit entfernte virtuelle Quelle, die am Punkt P ebene Wellen erzeugt, so wird zur Bestimmung des Soll-Amplitudenzustands der Abstand zwischen dem Punkt P und der Quelle nicht benötigt, da dieser ohnehin gegen unendlich geht. In diesem Fall wird lediglich eine Informationen über die Art der Quelle benötigt. Der Soll-Pegel am Punkt P ist dann gleich dem Pegel, der dem ebenen Wellenfeld, das durch die unendlich weit entfernte virtuelle Quelle erzeugt wird, zugeordnet ist.
Fig. 7 zeigt ein Diagramm zur Erläuterung des Ist-Amplitudenzustands. Insbesondere sind in Fig. 7b verschiedene Lautsprecher 808 gezeichnet, die alle mit einem eigenen Lautsprechersignal gespeist werden, das z. B. von dem Wellenfeldsynthesemodul 810 von Fig. 8 erzeugt worden ist. Ferner wird jeder Lautsprecher als Punktquelle modelliert, die ein konzentrisches Wellenfeld ausgibt. Die Gesetzmäßigkeit des konzentrischen Wellenfelds besteht wieder darin, daß der Pegel gemäß 1/r abfällt. Damit kann zur Berechnung des Ist-Amplitudenzustands (ohne Messung) das von dem Lautsprecher 808 unmittelbar an der Lautsprechermembran erzeugte Signal bzw. der Pegel dieses Signals auf der Basis der Lautsprechercharakteristika und des Komponentensignals im Lautsprechersignal LSn, das auf die betrachtete virtuelle Quelle zurückgeht, berechnet werden. Ferner kann aufgrund der Koordinaten des Punkts P und der Ortsinformationen zur Lage des Lautsprechers LSn der Abstand zwischen P und der Lautsprechermembran des Lautsprechers LSn ausgerechnet werden, so daß ein Pegel für den Punkt P aufgrund eines Komponentensignals erhalten werden kann, das auf die betrachtete virtuelle Quelle zurückgeht und von dem Lautsprecher LSn ausgesendet worden ist.
Eine entsprechende Prozedur kann für die anderen Lautsprecher des Lautsprecherarrays ebenfalls durchgeführt werden, so daß sich für den Punkt P eine Anzahl von "Teilpegelwerten" ergibt, die einen Signalbeitrag der betrachteten virtuellen Quelle darstellen, der von den einzelnen Lautsprechern zum Hörer am Punkt P gelangt ist. Durch Zusammenfassung dieser Teilpegelwerte wird dann der gesamte Ist-Amplitudenzustand am Punkt P erhalten, der dann, wie es ausgeführt worden ist, mit dem Soll-Amplitudenzustand verglichen werden kann, um einen Korrekturwert, der vorzugsweise multiplikativ ist, der jedoch prinzipiell additiv oder subtraktiv sein könnte, zu erhalten.
Erfindungsgemäß wird somit auf der Basis bestimmter Quellenformen der gewünschte Pegel für einen Punkt berechnet, also der Soll-Amplitudenzustand. Es wird bevorzugt, daß der Optimal-Punkt bzw. der Punkt im Vorführbereich, der betrachtet wird, sinnvollerweise in der Mitte des Wellenfeldsynthesesystems liegt. An dieser Stelle sei darauf hingewiesen, daß auch dann bereits eine Verbesserung erreicht wird, wenn der Punkt, der zur Berechnung des Soll-Amplitudenzustands zugrunde gelegt worden ist, nicht unmittelbar mit dem Punkt übereinstimmt, der zur Ermittlung des Ist-Amplitudenzustands verwendet worden ist. Nachdem eine möglichst gute Pegelartefaktreduktion für eine möglichst große Anzahl von Punkten im Vorführbereich angestrebt wird, ist es prinzipiell ausreichend, daß ein Soll-Amplitudenzustand für irgendeinen Punkt im Vorführbereich ermittelt wird, und daß ein Ist-Amplitudenzustand ebenfalls für irgendeinen Punkt im Vorführbereich ermittelt wird, wobei es jedoch bevorzugt wird, daß sich der Punkt, auf den der Ist-Amplitudenzustand bezogen ist, in einer Zone um den Punkt herum befindet, für den der Soll-Amplitudenzustand bestimmt worden ist, wobei diese Zone vorzugsweise kleiner als 2 Meter für normale Kinoanwendungen ist. Für beste Ergebnisse sollten diese Punkte im wesentlichen zusammenfallen.
Erfindungsgemäß wird somit nach Berechnung der Einzelpegel der Lautsprecher gemäß üblicher Wellenfeldsynthesealgorithmen der praktisch durch Überlagerung entstehende Pegel an diesem Punkt, der der Optimal-Punkt im Vorführbereich genannt wird, berechnet. Die Pegel der einzelnen Lautsprecher und/oder Quellen werden dann erfindungsgemäß mit diesem Faktor korrigiert. Für rechenzeiteffizienten Anwendungen wird es besonders bevorzugt, Korrekturfaktoren einmal für alle Positionen bei einer bestimmten Arrayanordnung zu berechnen und abzuspeichern, um dann im Betrieb auf die Tabelle zuzugreifen, um Rechenzeiteinsparungen zu erreichen.
An dieser Stelle sei insbesondere auf Fig. 6b hingewiesen, in der die Einrichtung 914 zum Summieren eingezeichnet ist, um das Summensignal 916 ausgangsseitig zu liefern, während eingangsseitig die skalierten Objektsignale 912 erhalten werden, die, wie es aus Fig. 6b ersichtlich ist, durch Skalieren der Quellensignale der Quellen 1, 2, 3 mit den entsprechenden Audioobjektskalierungswerten bzw. Korrekturwerten F1, F2, F3 erhalten werden. An dieser Stelle sei ferner darauf hingewiesen, daß für die vorliegende Erfindung der Tieftonkanalerzeugung die in Fig. 6b gezeigte Version bevorzugt wird, bei der bereits eine Skalierung bzw. Manipulation bzw. Korrektur auf Audioobjektsignalebene und nicht auf Komponentenebene, wie in Fig. 6a gezeigt, durchgeführt wird. Dennoch könnte auch das in Fig. 6a gezeigte Konzept der Korrektur auf Komponentenebene mit dem erfindungsgemäßen Konzept der Tieftonkanalerzeugung dadurch kombiniert werden, daß zumindest die Berechnung der Audioobjektskalierungswerte F1, F2, ..., Fn nur einmal durchgeführt werden muß.
Erfindungsgemäß erfolgt die Skalierung des Subwooferkanals somit ähnlich zu der Skalierung der Gesamtlautstärke aller Lautsprecher in dem Bezugspunkt des Wellenfeldsynthesewiedergabesystems. Das erfindungsgemäße Verfahren eignet sich somit für beliebig viele Subwooferlautsprecher, die alle so skaliert werden, daß sie im Mittelpunkt des Wellenfeldsynthesesystems eine Referenzlautstärke erreichen. Die Referenzlautstärke hängt hierbei nur von der Position der virtuellen Schallquelle ab. Mit den bekannten Abhängigkeiten von Entfernung des Klangobjekts zum Referenzpunkt und der damit verbundenen Dämpfung der Lautstärke wird vorzugsweise die Einzellautstärke des jeweiligen Klangobjekts für jeden Subwooferkanal berechnet werden. Die Verzögerung jeder Quelle berechnet sich aus dem Abstand der virtuellen Quelle zum Bezugspunkt der Lautstärkenskalierung. Jeder Subwooferlautsprecher gibt die Summe aller so umgerechneten Klangobjekte wieder. Wie sich die Einzellautstärken der Subwooferlautsprecher addieren, hängt von deren Position ab. Die bevorzugte Positionierung von Subwooferlautsprechern und die Auswahl der Anzahl von erforderlichen Subwoofern sind in den bereits erwähnten Fachveröffentlichungen Welti, Todd, "How Many Subwoofers are Enough", 112 ^th AES Conv. Paper 5602, Mai 2002, München, Deutschland, Martens, "The impact of decorrelated low-frequency reproduction on auditory spatial imagery: Are two subwoofers better than one?", 16^th AES Conf. Paper, April 1999, Rovaniemi, Finnland, dargelegt.
Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren zum Erzeugen eines Tieftonkanals, wie es anhand von Fig. 9 dargestellt ist, in Hardware oder in Software implementiert werden.
Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren zum Pegel-Korrigieren, wie es in Fig. 1 dargestellt ist, in Hardware oder in Software implementiert werden. Die Implementierung kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, daß das Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des Verfahrens zum Pegel-Korrigieren, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computer-Programm auf einem Computer abläuft.

Claims

Vorrichtung zum Erzeugen eines Tieftonkanals (940, 942, 944) für einen Tieftonlautsprecher (1106, 1110), mit folgenden Merkmalen:
einer Einrichtung (900) zum Bereitstellen einer Mehrzahl von Audioobjekten, wobei einem Audioobjekt ein Objektsignal und eine Objektbeschreibung zugeordnet ist;

einer Einrichtung (906) zum Berechnen eines Audioobjektskalierungswerts für jedes Audioobjekt abhängig von der Objektbeschreibung (904);

einer Einrichtung (910) zum Skalieren jedes Objektsignals mit einem zugeordneten Audioobjektskalierungswert (908), um ein skaliertes Objektsignal (912) für jedes Audioobjekt zu erhalten;

einer Einrichtung (914) zum Summieren der skalierten Objektsignale, um ein Summensignal (916) zu erhalten; und

einer Einrichtung (918) zum Bereitstellen des Tieftonkanals (920, 940, 942, 944) für den Tieftonlautsprecher (1106, 1110) basierend auf dem Summensignal (916).
Vorrichtung nach Anspruch 1, bei der der Tieftonlautsprecher an einer vorbestimmten Lautsprecherposition (1108, 1112) angeordnet ist, wobei die vorbestimmte Lautsprecherposition (1108) von einer Referenzwiedergabeposition (100) unterschiedlich ist, und
bei der die Einrichtung (918) zum Bereitstellen des Tieftonkanals ausgebildet ist, um einen Lautsprecherskalierungswert für den Tieftonlautsprecher abhängig von der vorbestimmten Lautsprecherposition (1108) zu berechnen, so daß ein Tieftonsignal an der Referenzwiedergabeposition (1100) eine Lautstärke hat, die einer Lautstärke des Summensignals (916) innerhalb eines vorbestimmten Toleranzbereichs entspricht, und
wobei die Einrichtung (918) zum Bereitstellen ferner ausgebildet ist, um das Summensignal (916) mit dem Lautsprecherskalierungswert zu skalieren, um den Tieftonkanal (920, 940, 942, 944) zu erzeugen.
Vorrichtung nach Anspruch 1 oder 2, bei der jedes Objektsignal ein Tieftonsignal mit einer oberen Grenzfrequenz kleiner oder gleich 250 Hz ist.
Vorrichtung nach Anspruch 1 oder 2, bei der das Summensignal (916) eine obere Grenzfrequenz hat, die höher als 8 kHz ist, und
bei der die Einrichtung (918) zum Bereitstellen des Tieftonkanals ausgebildet ist, um eine Tiefpaßfilterung mit einer Grenzfrequenz kleiner oder gleich 250 Hz durchzuführen.
Vorrichtung nach einem der vorhergehenden Ansprüche,
bei der ein Audioobjekt der Mehrzahl von Audioobjekten eine Objektbeschreibung umfaßt, die eine Audioobjektposition umfaßt, und
bei der die Einrichtung (906) zum Berechnen eines Audioobjektskalierungswerts für das Audioobjekt ausgebildet ist, um den Audioobjektskalierungswert abhängig von der Audioobjektposition des Audioobjekts und einer Referenzwiedergabeposition (1100) und abhängig von einer dem Audioobjekt zugeordneten Objektlautstärke durchzuführen.
Vorrichtung nach einem der vorhergehenden Ansprüche,
bei der eine Mehrzahl von Tieftonkanälen für eine Mehrzahl von Tieftonlautsprechern an vorbestimmten Tieftonlautsprecherpositionen erzeugbar ist, und
bei der die Einrichtung (918) zum Bereitstellen ausgebildet ist, um abhängig von der Position eines Tieftonlautsprechers und abhängig von einer Anzahl von weiteren Tieftonlautsprechern für jeden Tieftonlautsprecher einen Lautsprecherskalierungswert zu berechnen,
so daß ein Tieftonsignal, das eine Überlagerung von Ausgangssignalen aller Tieftonlautsprecher an der Referenzposition (1100) ist, eine Lautstärke hat, die einer Lautstärke des Summensignals (916) innerhalb eines vorbestimmten Toleranzbereichs entspricht.
Vorrichtung nach einem der vorhergehenden Ansprüche,
bei der die Einrichtung (906) zum Berechnen von Audioobjektskalierungswerten ferner ausgebildet ist, um einen Audioobjektverzögerungswert für jedes Audioobjekt zu berechnen, der von einer Objektposition und einer Referenzwiedergabeposition abhängt, und
bei der die Einrichtung (914) zum Summieren ausgebildet ist, um jedes Objektsignal oder jedes skalierte Objektsignal vor dem Summieren um den entsprechenden Audioobjektverzögerungswert zu verzögern.
Vorrichtung nach einem der vorhergehenden Ansprüche,
bei der die Einrichtung (918) zum Bereitstellen ausgebildet ist, um für einen Tieftonlautsprecher einen Tieftonlautsprecherverzögerungswert zu berechnen, der von einer Entfernung des Tieftonlautsprechers von der Referenzwiedergabeposition abhängt, und
bei der die Einrichtung (918) zum Bereitstellen ferner ausgebildet ist, um den Tieftonlautsprecherverzögerungswert beim Bereitstellen des Tieftonkanals zu berücksichtigen.
Vorrichtung nach Anspruch 2, bei der mehrere Tieftonlautsprecher vorgesehen sind, und bei der ferner die Einrichtung (918) zum Bereitstellen ausgebildet ist, um die Lautsprecherskalierungswerte so zu berechnen, daß für jeden Tieftonlautsprecher ein Lautsprecherskalierungswert gemäß folgender Gleichung erhalten wird: $(a_{1} + a_{2} + \dots + a_{n}) \cdot s = LSref,$

wobei LSref eine Referenzlautstärke an einer Referenzwiedergabeposition (1100) ist, wobei s das Summensignal (916) ist, wobei a₁ der Lautsprecherskalierungswert eines ersten Tieftonlautsprechers ist, wobei a₂ ein Lautsprecherskalierungswert eines zweiten Tieftonlautsprechers ist, und wobei a_n ein Lautsprecherskalierungswert eines n-ten Tieftonlautsprechers ist.
Vorrichtung nach Anspruch 9, bei der der Lautsprecherskalierungswert eines Tieftonlautsprechers von einer Entfernung des Tieftonlautsprechers von der Referenzwiedergabeposition (1100) abhängt.
Vorrichtung nach einem der vorhergehenden Ansprüche, die ausgebildet ist, um in einem Wellenfeldsynthesesystem mit einem Wellenfeldsynthesemodul (810) und einem Array (800) von Lautsprechern (808) zur Schallversorgung eines Vorführbereichs (802) zu arbeiten, wobei das Wellenfeldsynthesemodul ausgebildet ist, um ein einer virtuellen Schallquelle zugeordnetes Audiosignal sowie der virtuellen Schallquelle zugeordnete Quellenpositionsinformationen zu empfangen und unter Berücksichtigung von Lautsprecherpositionsinformationen Komponentensignale für die Lautsprecher aufgrund der virtuellen Quelle zu berechnen, und
bei der die Einrichtung (906) zum Berechnen der Audioobjektskalierungswerte (908) eine Einrichtung (100) zum Ermitteln eines Korrekturwerts als Audioobjektskalierungswert umfaßt, wobei die Einrichtung (100) zum Ermitteln ausgebildet ist, um den Audioobjektskalierungswert so zu berechnen, daß er auf einem Soll-Amplitudenzustand in dem Vorführbereich basiert, wobei der Soll-Amplitudenzustand von einer Position der virtuellen Quelle oder einer Art der virtuellen Quelle abhängt, und der ferner auf einem Ist-Amplitudenzustand in dem Vorführbereich basiert, der auf den Komponentensignalen für die Lautsprecher aufgrund der virtuellen Quelle basiert.
Vorrichtung nach Anspruch 11, bei der die Einrichtung (100) zum Ermitteln des Korrekturwerts (104) ausgebildet ist, um den Soll-Amplitudenzustand für einen vorbestimmten Punkt in dem Vorführbereich zu berechnen (500), und um den Ist-Amplitudenzustand für eine Zone in dem Vorführbereich zu bestimmen (502), die gleich dem vorbestimmten Punkt ist oder sich im Rahmen eines Toleranzbereichs um den vorbestimmten Punkt herum erstreckt.
Vorrichtung nach Anspruch 12, bei der der vorbestimmte Toleranzbereich eine Kugel mit einem Radius kleiner als 2 Meter um den vorbestimmten Punkt ist.
Vorrichtung nach einem der Ansprüche 11 bis 13, bei der die virtuelle Quelle eine Quelle für ebene Wellen ist, und bei der die Einrichtung (100) zum Ermitteln des Korrekturwerts ausgebildet ist, um einen Korrekturwert zu ermitteln, bei dem ein Amplitudenzustand des der virtuellen Quelle zugeordneten Audiosignals gleich dem Soll-Amplitudenzustand ist.
Vorrichtung nach einem der Ansprüche 11 bis 14, bei der die virtuelle Quelle eine Punktquelle ist, und bei der die Einrichtung (100) zum Ermitteln des Korrekturfaktors ausgebildet ist, um auf der Basis eines Soll-Amplitudenzustands zu arbeiten, der gleich einem Quotienten aus einem Amplitudenzustand des der virtuellen Quelle zugeordneten Audiosignals und dem Abstand zwischen dem Vorführbereich und der Position der virtuellen Quelle ist.
Vorrichtung nach einem der Ansprüche 11 bis 15,
bei der die Einrichtung (100) zum Ermitteln des Korrekturwerts ausgebildet ist, um basierend auf einem Ist-Amplitudenzustand zu arbeiten, für dessen Ermittlung eine Lautsprecher-Übertragungsfunktion des Lautsprechers (808) berücksichtigt ist.
Vorrichtung nach einem der Ansprüche 11 bis 16,
bei der die Einrichtung (100) zum Ermitteln des Korrekturfaktors ausgebildet ist, um für jeden Lautsprecher einen Dämpfungswert zu berechnen, der von der Position des Lautsprechers und einem zu betrachtenden Punkt im Vorführbereich abhängt, und bei der die Einrichtung (100) zum Ermitteln ferner ausgebildet ist, um das Komponentensignal eines Lautsprechers mit dem Dämpfungswert für den Lautsprecher zu gewichten, um ein gewichtetes Komponentensignal zu erhalten, und um ferner Komponentensignale oder entsprechend gewichtete Komponentensignale von anderen Lautsprechern zu summieren, um den Ist-Amplitudenzustand an dem betrachteten Punkt zu erhalten, auf dem der Korrekturwert (104) basiert.
Vorrichtung nach einem der Ansprüche 11 bis 17, bei der die Einrichtung (106) zum Manipulieren ausgebildet ist, um den Korrekturwert (104) als Korrekturfaktor zu verwenden, der gleich einem Quotienten aus dem Ist-Amplitudenzustand und dem Soll-Amplitudenzustand ist.
Vorrichtung nach Anspruch 18, bei der die Einrichtung (106) zum Manipulieren ausgebildet ist, um das der virtuellen Quelle zugeordnete Audiosignal vor dem Berechnen der Komponentensignale durch das Wellenfeldsynthesemodul (810) mit dem Korrekturfaktor zu skalieren.
Vorrichtung nach einem der Ansprüche 11 bis 19,
bei der der Soll-Amplitudenzustand ein Soll-Schallpegel ist, und bei der der Ist-Amplitudenzustand ein Ist-Schallpegel ist.
Vorrichtung nach Anspruch 20, bei der der Soll-Schallpegel und der Ist-Schallpegel auf einer Soll-Schallstärke bzw. einer Ist-Schallstärke basieren, wobei die Schallstärke ein Maß für eine Energie ist, die in einer Zeitdauer auf eine Bezugsfläche fällt.
Vorrichtung nach Anspruch 20 oder 21, bei der die Einrichtung (100) zum Ermitteln des Korrekturwerts ausgebildet ist, um den Soll-Amplitudenzustand durch abtastwertweises Quadrieren von Abtastwerten des Audiosignals, das der virtuellen Quelle zugeordnet ist, und durch Aufsummieren einer Anzahl von quadrierten Abtastwerten zu berechnen, wobei die Anzahl ein Maß für eine Beobachtungszeit ist, und
bei der die Einrichtung (100) zum Ermitteln des Korrekturwerts ferner ausgebildet ist, um den Ist-Amplitudenzustand zu berechnen, indem jedes Komponentensignal abtastwertweise quadriert wird und eine Anzahl von quadrierten Abtastwerten aufaddiert wird, die gleich der Anzahl von aufaddierten quadrierten Abtastwerten zur Berechnung des Soll-Amplitudenzustands ist, und wobei ferner Additionsergebnisse aus den Komponentensignalen aufaddiert werden, um ein Maß für den Ist-Amplitudenzustand zu erhalten.
Vorrichtung nach einem der Ansprüche 11 bis 22, bei der die Einrichtung (100) zum Ermitteln des Korrekturwerts (104) eine Nachschlagtabelle (400) aufweist, in der Positions-Korrekturfaktor-Wertepaare gespeichert sind, wobei ein Korrekturfaktor eines Wertepaars von einer Anordnung der Lautsprecher in dem Array von Lautsprechern und einer Position einer virtuellen Quelle abhängt, und wobei der Korrekturfaktor so gewählt ist, daß eine Abweichung zwischen einem Ist-Amplitudenzustand aufgrund der virtuellen Quelle an der zugeordneten Position und einem Soll-Amplitudenzustand bei einer Verwendung des Korrekturfaktors durch die Einrichtung (106) zum Manipulieren zumindest reduziert wird.
Vorrichtung nach Anspruch 23, bei der die Einrichtung (100) zum Ermitteln ferner ausgebildet ist, um einen aktuellen Korrekturfaktor für eine aktuelle Position der virtuellen Quelle aus einem oder mehreren Korrekturfaktoren aus Positions-Korrekturfaktor-Wertepaaren zu interpolieren (402), deren Position bzw. Positionen neben der aktuellen Position liegen.
Verfahren zum Erzeugen eines Tieftonkanals (940, 942, 944) für einen Tieftonlautsprecher (1106, 1110), mit folgenden Schritten:
Bereitstellen (900) einer Mehrzahl von Audioobjekten, wobei einem Audioobjekt ein Objektsignal und eine Objektbeschreibung zugeordnet ist;

Berechnen (906) eines Audioobjektskalierungswerts für jedes Audioobjekt abhängig von der Objektbeschreibung (904);

Skalieren (910) jedes Objektsignals mit einem zugeordneten Audioobjektskalierungswert (908), um ein skaliertes Objektsignal (912) für jedes Audioobjekt zu erhalten;

Summieren (914) der skalierten Objektsignale, um ein Summensignal (916) zu erhalten; und

Bereitstellen (918) des Tieftonkanals (920, 940, 942, 944) für den Tieftonlautsprecher (1106, 1110) basierend auf dem Summensignal (916).
Computerprogramm mit einem Programmcode zur Durchführen des Verfahrens nach Anspruch 25, wenn das Programm auf einem Computer abläuft.