DE102018120229A1 - Verfahren zur Auralisierung von Lautsprechern und Impulsantwort - Google Patents

Verfahren zur Auralisierung von Lautsprechern und Impulsantwort Download PDF

Info

Publication number
DE102018120229A1
DE102018120229A1 DE102018120229.6A DE102018120229A DE102018120229A1 DE 102018120229 A1 DE102018120229 A1 DE 102018120229A1 DE 102018120229 A DE102018120229 A DE 102018120229A DE 102018120229 A1 DE102018120229 A1 DE 102018120229A1
Authority
DE
Germany
Prior art keywords
impulse response
test
equalization
sound
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102018120229.6A
Other languages
English (en)
Inventor
Jürgen Schröder
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lowbeats Verlag GmbH
Original Assignee
Lowbeats Verlag GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lowbeats Verlag GmbH filed Critical Lowbeats Verlag GmbH
Priority to DE102018120229.6A priority Critical patent/DE102018120229A1/de
Publication of DE102018120229A1 publication Critical patent/DE102018120229A1/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Auralisierung von Lautsprechern (2) oder anderen breitbandigen Schallquellen, mit folgenden Schritten:a. Aufstellen von zumindest einem Testlautsprecher (2) in einem Aufnahmeraum, sowie Aufstellen von zumindest einem Mikrofon (8) in dem Aufnahmeraum;b. Abspielen eines vorbestimmten Eingangssignals (X, X) durch den zumindest einen Testlautsprecher und gleichzeitiges Aufnehmen des dadurch erzeugten Klangereignisses an dem zumindest einen Mikrofon (8) als Ausgangssignal (Y, Y);c. Berechnung einer Impulsantwort (10) des Testlautsprechers durch Entfaltung des Ausgangssignals mit dem Eingangssignal, oder durch Division des frequenztransformierten Ausgangssignals mit dem frequenztransformierten Eingangssignal und anschließender Transformation in den Zeitbereich;d. Nachbearbeitung der Impulsantwort (10) durch eine Entzerrung, insbesondere durch ein oder mehrere Filter, wobei insbesondere zumindest ein Entzerrungs-Filter nur in einem bestimmten Zeitfenster angewendet wird;e. Bereitstellen der nachbearbeiteten Impulsantwort (11) für den Testlautsprecher.

Description

  • GEBIET DER ERFINDUNG
  • Die Erfindung betrifft ein Verfahren zur Auralisierung von Lautsprechern oder anderen breitbandigen Schallquellen, insbesondere ein Verfahren zur Erstellung einer Impulsantwort eines Lautsprechers, sowie eine entsprechende Impulsantwort bzw. Übertragungsfunktion, sowie ein Verfahren zum Testen von Lautsprechern und ein Computerprogramm.
  • HINTERGRUND DER ERFINDUNG
  • Um Lautsprecher miteinander zu vergleichen, beispielsweise bei einem Lautsprecher-Test in der Redaktion einer Hi-Fi-Zeitschrift oder beim Kauf von Lautsprechern, werden üblicherweise die zu vergleichenden Lautsprecherpaare nacheinander in einem Raum mit geeigneter Akustik aufgestellt und ein bestimmtes Musikstück nacheinander auf den verschiedenen Lautsprecherpaaren abgespielt. Manchmal werden auch zwei Lautsprecherpaare gleichzeitig im Raum aufgestellt, damit der Wechsel von einem auf das andere Paar schneller erfolgen kann. Diese Methoden haben jedoch gravierende Nachteile: Zum einen ist das menschliche Hörgedächtnis sehr kurz. Wenn ein Lautsprecher-Paar gegen ein anderes ausgetauscht wird, dauert dies bereits so lange, dass nach dem Umbau keine verlässliche Referenz zur Beurteilung des zweiten Lautsprecherpaares vorhanden ist. Zudem muss auch ein gewissenhafter Lautstärkeabgleich beider Paare vorgenommen werden, weil das „lautere“ Lautsprecherpaar aufgrund der Physiologie des Gehörs ansonsten von vornherein als das besser klingende abschneidet.
  • Darüber hinaus ist auch die Position eines Lautsprechers stark für dessen wahrgenommene Qualität ausschlaggebend. Wurden die Lautsprecherpaare also nicht exakt gleich aufgestellt, ergeben sich bereits hieraus Unterschiede im Hörerlebnis, die jedoch nicht auf die Lautsprecher an sich zurückgehen, sondern auf deren Position im Raum. Stellt man von vornherein zwei Lautsprecherpaare im Raum auf, haben diese im jeden Fall eine andere Position und liefern daher nicht das gleiche Hörerlebnis. Darüber hinaus wird das subjektive Hörempfinden auch häufig durch visuelle Eindrücke beeinflusst. Das bedeutet, dass das Aussehen der Lautsprecher (groß/klein) ebenfalls das Ergebnis eines derartigen Hörtests beeinflusst.
  • Für den Vertrieb von Lautsprechern ergibt sich schließlich das Problem, dass die Lautsprecher zum Probehören physisch vor Ort sein müssen - gerade bei hochpreisigen Lautsprechern limitiert dies die Auswahl für den Kaufinteressierten erheblich.
  • Timo Hiekkanen, Aki Mäkivirta und Matti Karjalainen: „Virtualized Listening Tests for Loudspeakers“, J. Audio Eng. Soc., Vol. 57, Nr. 4, April 2009, S. 237 präsentieren ein Verfahren, mit dem die Eigenschaften eines Lautsprechers durch seine im Raum gemessene Impulsantwort bzw. Übertragungsfunktion beschrieben werden. Die Impulsantwort kann mit beliebiger Eingangsmusik gefaltet werden und das Ergebnis vermittelt einen Höreindruck des Lautsprechers. Dieses Verfahren geht zurück auf eine Technik, die ursprünglich dazu entwickelt wurde, das Klangerlebnis in Konzertsälen festzuhalten, siehe beispielsweise Angelo Farina: „Impulse Response Measurements by Exponential Sine Sweeps“, Workshop Casa della Musica, Parma, 18. Oktober 2008.
  • Hiekkanen et al. verwenden dabei binaurale Aufnahmen sowohl an einem Kunstkopf, als auch am Ohr von Testpersonen. Mathematisch kann das Verfahren mit Bezug auf 1 wie folgt ausgedrückt werden: Y l = X l H ll + X r H rl
    Figure DE102018120229A1_0001
    Y r = X l H lr + X r H rr
    Figure DE102018120229A1_0002
  • Ein Eingangs- oder Testsignal Xl und Xr , wobei I für links und r für rechts steht, wird am linken bzw. rechten Lautsprecher abgespielt. Das Eingangssignal ist ein Audiosignal, also ein elektrisches Signal, das akustische Informationen transportiert. Am linken und rechten Ohr des Kunstkopfes bzw. der Testperson werden gleichzeitig die Audiosignale Yl und Yr aufgenommen. Die Übertragungsfunktionen Hij , wobei i und j jeweils für links oder rechts stehen, beschreiben die Übertragung des Tonsignals im Frequenzraum vom Lautsprechereingang zum Ohr. Aus den Eingangssignalen Xl und Xr und den gemessenen Signalen Yl und Yr lassen sich durch Division die Übertragungsfunktionen Hll , Hrl , Hlr und Hrr ermitteln. Durch Fourier-Transformation oder mathematisch vergleichbare Transformationen kann aus den Übertragungsfunktionen eine Impulsantwort I, bzw. mehrere Impulsantworten Ill , Irl , Ilr und Irr (auch als eine Impulsantwort mit mehreren Kanälen bzw. als Impulsantwortkanäle bezeichnet) berechnet werden. Diese können wiederum mit jedem beliebigen Eingangssignal gefaltet werden und das Ergebnis beispielsweise über Kopfhörer von einer Testperson gehört werden. Gegebenenfalls ist noch die Impulsantwort des Kopfhörers zu berücksichtigen. Hiekkanen et al. haben dieses Verfahren getestet, mit akzeptablen Ergebnissen. Allerdings zeigten sich auch Probleme: Insbesondere war die Reproduzierbarkeit insbesondere am Kopf von Testpersonen nicht sehr gut: Die Unterschiede zwischen einzelnen Messungen waren teilweise größer als die Unterschiede zwischen den verschiedenen Lautsprechern.
  • Bei einer Nacharbeitung des von Hiekkanen entwickelten Verfahrens zeigte sich ferner, dass die so erhaltenen Impulsantworten keine wirklich authentische Klangwiedergabe von Lautsprechern ermöglichten. Insbesondere bei breitbandigen Signalen, zum Beispiel Tonmaterial mit perkussiven Charakter, stellen sich hörbare spektrale Verfärbungen ein, weshalb das Verfahren auch noch nicht über die Testphase hinaus gediehen ist. Für kommerzielle Anwendungen ist es aber notwendig, dass - egal bei welchem Tonmaterial - die Impulsantworten der verschiedenen getesteten Lautsprecher ein authentisches Hörerlebnis vermitteln. Darüber hinaus wurde auch noch keine Möglichkeit beschrieben, den Hörvergleich verschiedener Lautsprecher einem breiten Publikum zur Verfügung zu stellen.
  • AUFGABE DER ERFINDUNG
  • Die Erfindung hat sich daher die Aufgabe gesetzt, ein Verfahren zur Auralisierung von Lautsprechern bereitzustellen, mit dem sich das spezifische Schallleistungs-profil von Lautsprechern klanglich besonders authentisch darstellen lässt. Dies gilt sowohl für Echtzeitaufnahmen als auch für die Auralisierung der zu vergleichenden Lautsprecher mittels Impulsantwort. Darüber hinaus ist es auch ein Ziel der Erfindung, eine Softwareanwendung bereitzustellen, mit welcher einem breiteren Publikum der Vergleich von Lautsprechern mit selbst gewählter Musik ermöglicht wird, ohne dass die Lautsprecher physisch anwesend sein müssen.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die Erfindung erreicht dies mit dem Verfahren zur Auralisierung von Lautsprechern gemäß Anspruch 1, einer Impulsantwort und einer Übertragungsfunktion gemäß Anspruch 14 und 15, einem Verfahren zum Testen von Lautsprechern gemäß Anspruch 18, einem Audiofile gemäß Anspruch 20 sowie einem Computerprogramm gemäß Anspruch 21. Bevorzugte Ausführungsformen sind in den Unteransprüchen angegeben und in der nachfolgenden Beschreibung beschrieben. Die im Zusammenhang mit einem Aspekt bzw. einer Anspruchskategorie beschriebenen Merkmale, Vorteile und bevorzugten Ausführungsformen der Erfindung sind auch auf die jeweils anderen Aspekte und Kategorien anwendbar.
  • Das Verfahren zur Auralisierung von Lautsprechern oder anderen breitbandigen Schallquellen gemäß Anspruch 1 hat die folgenden Schritte:
    1. a) Aufstellen von zumindest einem Testlautsprecher in einem Aufnahmeraum sowie Aufstellen von zumindest einem Mikrofon in dem Aufnahmeraum;
    2. b) Abspielen eines vorbestimmten Eingangssignals durch den zumindest einen Testlautsprecher und gleichzeitiges Aufnehmen des dadurch erzeugten Klangereignisses an dem zumindest einem Mikrofon als Ausgangssignal;
    3. c) Berechnung einer Impulsantwort des Testlautsprechers durch Entfaltung des Ausgangssignals mit dem Eingangssignal oder durch Division des frequenztransformierten Ausgangssignals mit dem frequenztransformierten Eingangssignal und anschließender Transformation in den Zeitbereich;
    4. d) Nachbearbeitung der Impulsantwort, insbesondere durch eine Entzerrung, insbesondere durch ein oder mehrere Filter;
    5. e) Bereitstellen der nachbearbeiteten Impulsantwort für den Testlautsprecher.
  • Der Erfindung liegt die Erkenntnis zugrunde, dass die Impulsantwort nachbearbeitet werden muss, um ein realistisches Hörerlebnis zu liefern, z.B. durch eine Entzerrung, insbesondere durch eine Pegelanhebung und -senkung in einem oder mehreren Frequenzbereichen, insbesondere durch ein oder mehrere Filter, oder durch gezieltes Ausblenden (Fade-Out). Insbesondere wird die Nachbearbeitung an den Aufnahmeraum und/oder an das/die verwendeten Mikrofon(e) angepasst. Dies kann durch eine automatische Analyse der Impulsfunktion geschehen, oder durch ein Visualisierung und anschließendem Festlegen der Art der Nachbearbeitung. Die Nachbearbeitung kann durch eines oder mehrerer Filter, insbesondere Entzerrungs-Filter, erfolgen oder durch ein oder mehrere Fade-Outs, d.h. ein allmähliches Ausblenden des späten Signalanteils. Der oder die Filter bzw. Fade-Out(s) können dann für alle in diesem Aufnahmeraum und/oder mit diesem Mikrofon bzw. diesem Setup von Mikrofonen erzeugten Impulsantworten verwendet werden.
  • Dem erfindungsgemäßen Verfahren liegt die Erkenntnis zugrunde, dass in der gemessenen Impulsantwort stets nicht nur die Eigenschaften des schallerzeugenden Lautsprechers, sondern auch die des nachhallenden Raumes sowie die Eigenschaften des Mikrofon-Setups enthalten sind - eine Trennung der verschiedenen Übertragungsfunktionen ist nicht ohne weiteres möglich. Ferner berücksichtigt die erfindungsgemäße Nachbearbeitung die Tatsache, dass der Mensch Höreindrücke anders wahrnimmt als ein aufgestelltes Mikrofon: So kann ein Mensch z.B. automatisch zwischen Direktschall und der Erstreflexion unterscheiden und somit die gehörten Erstreflexionen (beispielsweise am Boden) richtig einordnen. Wenn diese jedoch von einem Mikrofon aufgenommen werden, kann dies zu einem verzerrten Hörerlebnis führen.
  • Die Erfindung hat somit erkannt, dass je nach Aufnahmetechnik und akustischer Umgebung das Erstellen von Impulsantworten zur Auralisierung von Lautsprechern ein mehr oder weniger aufwendiges Post Processing erfordert. Auf diese Weise rücken die mit Impulsantworten erzielbaren Ergebnisse jedoch auch deutlich näher an die gehörphysiologisch erfasste „Realität“ als mit herkömmlichen Aufnahmetechniken, wie beispielsweise von Hiekkanen beschrieben.
  • Das Verfahren eignet sich zur Auralisierung (Hörbarmachung) von Lautsprechern, aber auch von anderen breitbandigen Schallquellen wie beispielsweise Musikinstrumenten, zum Beispiel Klavieren. Wenn daher im Folgenden von „Lautsprecher“ oder „Testlautsprecher“ die Rede ist, kann es sich hierbei auch um eine andere Schallquelle handeln. Es kann auch eine bestimmte Kombination von Lautsprecher und Aufnahmeraum auralisiert werden, z.B. ein Kraftfahrzeug. Die Erfindung eignet sich auch zur Auralisierung des Aufnahmeraumes, in diesem Fall würden die gleichen Schallquellen in verschiedenen Aufnahmeräumen oder Sälen, z.B. Konzertsälen aufgestellt und die verschiedenen Impulsantworten für den Vergleich genutzt.
  • Zur Aufnahme ist der Testlautsprecher in einem Aufnahmeraum aufzustellen, wobei die Testaufnahme grundsätzlich auch im Freien (oder gleichbedeutend: einem reflexionsarmen Messraum) erfolgen kann. In einer vorteilhaften Ausführungsform handelt es sich bei dem Aufnahmeraum um den Fahrgastraum eines Kraftfahrzeugs, wobei die Testlautsprecher in diesem Fall vorteilhaft eine Lautsprecheranlage des Kraftfahrzeugs sind. Auf diese Weise ist es möglich, einem potentiellen Autokäufer die verschiedenen für dieses Kfz verfügbaren Lautsprecheranlagen vorzuführen. In einer anderen vorteilhaften Ausführungsform erfolgt das Verfahren in einem speziellen Aufnahmeraum, insbesondere in einem Raum mit hörraumtypischen Abmessungen, also einem Raum mit 10 bis 60 m2, vorzugsweise 15-45 m2 Fläche und z.B. einer Raumhöhe bis zu 5m, insbesondere in einem Wohnraum. Vorteilhaft ist der Aufnahmeraum rechteckig mit einer Wandlänge bis zu 10m. Vorzugsweise ist der Aufnahmeraum zumindest annähernd akustisch verfärbungsfrei. Dies ist allein schon deshalb sinnvoll, weil die Lautsprecher später bei Kunden auch in einem Innenraum (Wohnraum) stehen werden. In vorteilhaften Ausführungsformen wird eine ein- oder mehrkanalige Anordnung von Lautsprechern von Testlautsprechern, mit der Musik in typischer Stereophonie (oder Mehrkanaltechnik) abgespielt werden kann, vermessen. Typischerweise werden die Testlautsprecher an zwei für die Stereophonie geeigneten Positionen aufgestellt und nacheinander das vorbestimmte Eingangssignal an den beiden Testlautsprechern abgespielt. Somit braucht man für die Auralisierung auch kein Paar, sondern nur einen Lautsprecher, der nacheinander an den beiden Positionen aufgestellt wird. Die Aufnahme erfolgt an dem zumindest einen Mikrofon, wobei sich hierfür sowohl klassische Stereo-Mikrofonie-Verfahren in Intensitäts- und Laufzeittechnik (XY, MS, AB) als auch binaurale Verfahren mit einem Kunstkopf (beispielsweise von Neumann) oder 360°-Verfahren, beispielsweise mit Ambisonics-Mikrofon eignen. Bei den beiden letzteren ist der räumliche Eindruck intensiver, der Produktionsaufwand allerdings auch höher.
  • Gemäß einer bevorzugten Ausführungsform umfasst die erfindungsgemäße Nachbearbeitung eine zeitabhängige Entzerrung der gemessenen (bzw. durch Entfaltung des Ausgangs- mit dem Eingangssignal gewonnenen) Impulsantwort. Das bedeutet insbesondere, die Impulsantwort wird sowohl zeitabhängig als auch frequenzabhängig nachbearbeitet, beispielsweise dadurch, dass bestimmte Equalization- bzw. Entzerrungs-Filter nur in bestimmten Zeitfenstern angewendet werden, was im Folgenden auch mit Time-Windowed Equalization bezeichnet wird. Unter einem Filter wird z.B. ein Bandpassfilter verstanden, welcher innerhalb eines bestimmten Tonfrequenzbereichs (definiert z.B. durch eine Mittenfrequenz und eine Filterbandbreite) eine Pegelanhebung oder -senkung (in der Regel definiert in dB) durchführt. Es kann auch ein Hochpass- oder Tiefpassfilter sein.
  • Gemäß einer bevorzugten Ausführungsform umfasst die Impulsantwort mehrere Impulsantwortkanäle, die jeweils das Impulsansprechverhalten (genau) eines Mikrophonkanals auf (genau) einen Testlautsprecher im Raum darstellen. Wenn im Folgenden von „Impulsantwort“ gesprochen wird, ist somit impliziert, dass die Impulsantwort mehrere Impulsantwortkanäle umfassen kann, welche jeweils das Impulsansprechverhalten eines (der gegebenenfalls mehreren) Mikrofon(e) durch einen (der gegebenenfalls mehreren) Testlautsprecher darstellen. In anderen Worten wird das an dem einen Mikrofon gewonnen Ausgangssignal mit dem von einem Testlautsprecher abgespielten Eingangssignal entfaltet und so ein Impulsantwortkanal gewonnen, z.B. einer der o.g. Ill , Irl , Ilr und Irr . Wenn von Nachbearbeitung die Rede ist, betrifft dies typischerweise alle Impulsantwortkanäle.
  • Gemäß einer bevorzugten Ausführungsform umfasst die Impulsantwort Impulsantwortkanäle für ein Paar Testlautsprecher. Dabei kann ein Aufbau wie in 1 verwendet werden. Vorteilhaft wird bei dem Verfahren nacheinander jeweils ein Testlautsprecher aufgestellt und die Ausgangssignale werden entsprechend nacheinander an den Mikrophonen aufgenommen.
  • Das Eingangssignal ebenso wie das Ausgangssignal sind bevorzugt Audiosignale, also insbesondere elektrische Signale, die akustische Informationen transportieren. Das Eingangs- und Ausgangssignal kann z.B. die Pegelhöhe gegen die Zeit darstellen. Auf digitaler Ebene liegen Eingangs- und Ausgangssignal vorzugsweise in einem verbreiteten Datenformat vor, z.B. in einem RIFF-WAVE Format, in einem AIFF (Audio Interchange File Format), einem FLAC (Free Lossless Audio Codec) oder einem anderen gebräuchlichen Datenformat. Beispielsweise wird eine Abtastrate von 48kHz verwendet. Ein Messzyklus (also das Abspielen des Eingangssignals) kann z.B. 0,5 sec bis 50 sec dauern, typischerweise 1 bis 5 sec wobei in dieser Zeit keinerlei Nebengeräusche im Aufnahmeraum auftreten sollten. Es wird bevorzugt ein vorbestimmtes Eingangssignal verwendet, welches zu jedem Zeitpunkt nur eine Tonfrequenz enthält, also einen möglichst reinen Ton ohne Oberwellen. In bevorzugten Ausführungsformen verändert sich die Frequenz dieses einen Tons langsam in einem „Sweep“ von hohen zu niedrigen oder von niedrigen zu hohen Frequenzen. Die kann ein logarithmischer Sweep sein. In anderen Ausführungsformen kann das Eingangssignal auch ein digital erzeugtes Rauschsignal (pseudo random noise; maximum length sequence) sein. Bevorzugt deckt das Eingangssignal den hörbaren Frequenzbereich ab, also z.B. von 10Hz bis 30kHz, bevorzugt von 16 Hz bis 20kHz.
  • Das Eingangssignal wird z.B. von einen Computer mit Soundkarte oder Audio-Interface ausgegeben. Dieser ist mit einem Verstärker verbunden, an den der/die Testlautsprecher angeschlossen sind. Während das Eingangssignal abgespielt wird, wird es bevorzugt gleichzeitig durch den Computer aufgezeichnet, sodass Eingangs- und Ausgangssignal zeitlich synchronisiert bleiben. Dies ist für die weitere Verarbeitung des Eingangssignals je nach Software vorteilhaft.
  • Die Berechnung der Impulsantwort des Testlautsprechers (bzw. der Impulsantwortkanäle der verschiedenen Testlautsprecher) geschieht entweder in der Zeitdomäne durch Entfaltung (englisch: „deconvolution“) des am Mikrofon aufgenommenen Ausgangssignals mit dem dem Lautsprecher zugeführten Eingangssignal (bzw. dem o.g. Referenzsignal) oder durch ein mathematisch vergleichbares Verfahren, z.B. Laplace-Transformation. Die Entfaltung wird z.B. durchgeführt mit einer kommerziell erhältlichen Software wie z.B. Pinguin HDIR Creator. Wenn das Eingangssignal z.B. einen logarithmischen Sweep von niedrigen zu hohen Frequenzen umfasst, kommt vor der Faltung vorzugsweise ein frequenzinverses Filter (von hohen zu niedrigen Frequenzen) zur Kompensation zum Einsatz.
  • Alternativ kann die Berechnung auch im Frequenzraum erfolgen, wobei dann das frequenztransformierte Ausgangssignal mit dem frequenztransformierten Eingangssignal dividiert wird. So erhält man die sogenannte Übertragungsfunktion zwischen Lautsprecher und Mikrofon. Wenn diese wieder in den Zeitbereich transformiert wird, ergibt sich daraus die Impulsantwort. Die Transformation zwischen Zeitbereich und Frequenzbereich kann durch Fourier-Transformation, Laplace-Transformation oder durch entsprechende für digitale Daten geeignete Annäherungen dieser Verfahren geschehen, beispielsweise Fast Fourier Transform, die dem Fachmann im Tontechnikbereich bekannt sind.
  • Da das System Lautsprecher-Aufnahmeraum-Mikrofon nur unter bestimmten Bedingungen ein lineares, zeitinvariantes System darstellt, kann die Faltung auch mit Volterra-Kernel basierten Verfahren durchgeführt werden. Dieses Verfahren basiert auf dem von Vito Volterra entwickelten Modell für ein nicht-lineares System (siehe Wikipedia: „Volterra Series“). Dies setzt jedoch voraus, dass das Eingangssignal mit verschiedenen Lautstärken aufgenommen wird, was die Messung aufwendiger macht. Dafür erlaubt dies Verfahren auch die Hörbarmachung von Klirrkomponenten der Lautsprecher und erlaubt eine Beurteilung des dynamischen Verhaltens von Lautsprechern.
  • Die Impulsantwort liegt dann vorzugsweise ebenfalls in einem digitalen Audioformat vor, z.B. z.B. in einem RIFF-WAVE Format, in einem AIFF (Audio Interchange File Format) oder einem FLAC (Free Lossless Audio Codec), z.B. in einem mehrkanaligen WAVE-Format, also einem WAVE File mit mehreren Tonspuren.
  • Die Nachbearbeitung der Impulsantwort wird im Folgenden noch genauer beschrieben. Die so nachbearbeitete Impulsantwort für den Testlautsprecher kann im Hörvergleich zwischen zwei oder mehreren Testlautsprecherpaaren oder Mehrkanal-Anordnungen verwendet werden. Dies erfolgt gemäß einem Aspekt der Erfindung mit einer speziellen Komparator-Software mit dem Computerprogramm gemäß Anspruch 21: Dazu werden zunächst die akustischen Fingerabdrücke der Lautsprecherpaare (nachbearbeitete Impulsantworten) in Form digitaler Datenfiles geladen. Diese werden von der Komparator-Software in Echtzeit mit beliebigem Musikmaterial verrechnet (insbesondere durch Faltung mit der Impulsantwort) und das Ergebnis verzögerungsfrei wiedergegeben. Für den Zuhörer entsteht hierdurch der Eindruck, als höre er Musik über das ihn interessierende Lautsprecherpaar bei optimaler, z. B. stereofonischer Aufstellung (im Sweet Spot) in einem akustisch günstigen Raum. Das Umschalten für einen direkten Vergleich mit einem weiteren Lautsprecherpaar oder -ensemble ist dabei jederzeit und bei laufender Musik möglich - ohne Warte- bzw. Umschaltzeit und insbesondere ohne Lautstärkesprünge.
  • Die Wiedergabe erfolgt vorzugsweise über Kopfhörer, wobei sich bereits mit preisgünstigen Modellen sehr gute Ergebnisse erzielen lassen. Möglich ist die Wiedergabe aber auch über klangneutrale Aktiv-Lautsprecher bei kurzem Hörabstand (im Nahfeld bzw. Freifeld) bei vorzugsweise seitlicher Anordnung. Unterstützend wirkt in beiden Fällen der Effekt, dass das menschliche Gehör bei relativen Vergleichen sehr präzise wahrnimmt, sodass auch die klanglichen Unterschiede verwandter Lautsprecherpaare - beispielsweise kleinere und größere Mitglieder der gleichen Boxenfamilie - gut zu erkennen sind.
  • Zusammenfassend weisen das erfindungsgemäße Verfahren bzw. die bevorzugten Ausführungsformen die folgenden Vorteile auf:
    • Für den Kaufinteressenten:
      1. 1. Je nach Umfang der Bibliothek von Impulsantworten oder gerenderten Musikstücken stehen beliebig viele Lautsprecher zum Hörvergleich bereit.
      2. 2. Das frequenzneutrale akustische Umfeld während der Aufnahme gemäß Schritt b) ermöglicht einen objektiven Vergleich zwischen den Lautsprechern ohne störende Klangeinflüsse - so, wie sie vom Hersteller gedacht sind.
      3. 3. Durch das präzise Ausrichten der Lautsprecher bereits während des Messvorgangs braucht sich der Zuhörer nicht mehr um die Aufstellung zu kümmern - er befindet sich stets im optimalen Hörbereich (Sweet Spot).
      4. 4. Durch den direkten, unterbrechungsfreien A-B-Vergleich von Lautsprechern werden auch feine Unterschiede zwischen den Modellen hörbar.
      5. 5. Der Hörvergleich zwischen den Lautsprechern ist mit beliebigen Musiktiteln oder hörbaren Testsignal-Sequenzen möglich, so dass sich eventuelle Präferenzen leicht erkennen lassen.
    • Für den Handel:
      1. 1. Die Lautsprecher müssen nicht physisch vorhanden sein - zum Vergleichshören ist lediglich das Datenfile mit dem jeweiligen akustischen Fingerabdruck (der Impulsantwort) erforderlich. Das spart Standfläche und Lagerplatz.
      2. 2. Das Verfahren erlaubt eine quasi unbegrenzte, zudem flexible Lautsprecherauswahl in der zum Hörvergleich angebotenen Datenbank, die sich zudem jederzeit aktualisieren lässt.
      3. 3. Aufwändige Umschaltanlagen können ebenso entfallen wie akustisch aufwändig gestaltete Vorführräume.
      4. 4. Das Verfahren eignet sich nicht nur zur Präsentation von HiFi-Lautsprechern, sondern auch für Soundbars oder Bluetooth-Speaker.
      5. 5. Einmal erstellt, lässt sich der akustische Fingerabdruck (die Impulsantwort) eines Lautsprechers mit beliebigen Musiktiteln verarbeiten. Änderungen im Musikprogramm, z. B. für Features, sind daher jederzeit auch nachträglich durchführbar.
    • Für den Lautsprecherhersteller:
      1. 1. Die Lautsprecher spielen unter akustisch günstigen Bedingungen und können somit ihr volles Klangpotenzial entfalten
      2. 2. Durch die virtuelle „Single Speaker Demonstration“ entfallen klangmindernde Einflüsse durch ungünstige Aufstellung oder benachbarte Lautsprecher - das Produkt wird präsentiert, wie vom Entwickler vorgesehen.
  • Die Nachbearbeitung der Impulsantwort kann sowohl eine zeitabhängige (dynamische) Entzerrung umfassen, als auch eine nicht-zeitabhängige Entzerrung. Die Entzerrung kann mittels ein oder mehrerer Filter durchgeführt werden, welche entweder im gesamten Zeitbereich angewendet werden (nicht-zeitabhängige Entzerrung) oder jeweils nur in einem oder mehreren bestimmten Zeitfenster(n) (zeitabhängige Entzerrung). Darüber hinaus kann die Nachbearbeitung auch ein oder mehrere Fade-Outs beinhalten, die frequenzselektiv oder nicht-frequenzselektiv sein können. Die nicht zeitabhängige Entzerrung kann entweder auf die Impulsantwort angewendet werden, sie kann aber auch erst beim Ausgeben des gefalteten Audiosignals, insbesondere über einen Kopfhörer, in einem Verfahren gemäß Anspruch 18 zu Anwendung kommen. Letztere Variante hat den Vorteil, dass die Art der Entzerrung an den verwendeten Kopfhörer angepasst werden kann. Alternativ kann eine nicht zeitabhängige Entzerrung auch im Rahmen eines Pre-Equalizing durchgeführt werden, also bereits auf das Eingangssignal angewendet werden.
  • Gemäß einer bevorzugten Ausführungsform umfasst eine zeitabhängige Entzerrung bzw. ein oder mehrere Filter für die Nachbearbeitung der Impulsantwort ein oder mehrere Fenster, in denen die Signalamplitude der Impulsantwort frequenzselektiv angehoben oder gedämpft wird. Jedes Fenster ist z.B. im Zeit- und im Frequenzbereich definiert, umfasst in diesem Fall also nicht den gesamten Zeitbereich der Impulsantwort, sondern ist auf einen definierten Zeitbereich begrenzt. In anderen Worten umfasst die zeitabhängige Entzerrung bevorzugt eine Pegeldämpfung oder Pegelanhebung in zumindest einem definierten Fenster im Zeit- und Frequenzbereich.
  • Besonders bevorzugt weisen diese Fenster, insbesondere im Zeitbereich, eine Fensterfunktion auf, welche abgerundete Flanken besitzen. Vorteilhaft werden also keine Rechteckfenster verwendet, um keine Oberwellen zu generieren. Es kommen verschiedene Fensterfunktionen in Frage, welche vorteilhaft einen steilen Anstieg aufweisen, um z.B. die Schallfront des Direktschalls zu erfassen, an der hinteren Kannte jedoch sanft abgerundet sind. Die Fensterfunktion ist also bevorzugt unsymmetrisch. Beispielsweise kann es sich um ein Von-Hann-Fenster, ein Hanning-Fenster, ein Blackman-Fenster oder ein Tukey-Fenster handeln, wobei es sich um eine abgeflachte Kosinus-Fensterfunktion handelt. In einem derartigen Fenster kann dann z.B. ein Bandfilter mit bestimmter Mittenfrequenz und Bandbreite angewendet werden.
  • Vorteilhaft können auch mehrere entsprechende Fenster vorhanden sein. Bevorzugt ist zumindest ein Fenster einer zeitabhängigen Entzerrung in einem Zeitbereich vorhanden, in dem Anteile des Direktschalls vorhanden sind, insbesondere reicht das Zeitfenster bis zu 60ms nach Aufnahmebeginn, bevorzugt bis zu 50ms nach Aufnahmebeginn. Dies entspricht einen Zeitfenster von ca. bis zu 30ms (um auch die früheren Reflektionen zu erfassen), bevorzugt bis zu 25ms, stärker bevorzugt bis zu 18ms nach Eintreffen des Direktschallanteils, also nach der initialen Flanke der Impulsantwort.
  • Gemäß einer weiteren Ausführungsform umfasst die zeitabhängige Entzerrung eine Pegelanhebung oder -absenkung in einem Zeitfenster, welches den Diffusschallanteil umfasst, also insbesondere in einem Zeitfenster von mehr als 20ms nach Eintreffen des Direktschallanteils oder von mehr als 60ms nach Aufnahmebeginn, bspw. 20 - 1500ms, bevorzugt 50 - 1000ms nach Eintreffen des Direktschallanteils.
  • Bevorzugt beinhaltet die zeitabhängige Nachbearbeitung bzw. Entzerrung, dass verschiedene Filter auf den dem Freifeld entsprechenden Zeitabschnitt der Impulsantwort und auf den dem Diffusfeld entsprechenden Zeitabschnitt angewendet werden.
  • Gemäß einer bevorzugten Ausführungsform ist das Eingangssignal ein exponentielles Sinus-Sweep-Signal. Dieses wurde bereits von Angelo Farina zur Auralisierung von Räumen verwendet. Es handelt sich hierbei um ein Sinussignal, dessen Frequenz exponentiell mit der Zeit verändert wird, wobei die Frequenz bei einer festgelegten Frequenz f1 anfängt und bei f2 aufhört. Dieses Signal hat den Vorteil, dass alle Frequenzen einzeln gesampelt und zudem Lautsprecher samt Raum auch bei tiefen Frequenzen ausreichend lang angeregt werden. Dies ist besonders günstig für die erfindungsgemäße Nachbearbeitung der Impulsantwort, die wie gesagt nicht nur die übliche Equalization beinhaltet, sondern eine zeitabhängige Nachbearbeitung, d.h. es wird nicht nur das Frequenzspektrum festgehalten, sondern auch dessen Zeitverhalten. In anderen Worten geht die Erfindung nicht zwingend davon aus, dass das System Lautsprecher-Raum-Mikrofon-Aufstellung ein perfekt lineares, zeitinvariantes System ist, bei welchem das Ausgangssignal stets die gleiche Frequenz wie das Eingangssignal hat, jedoch eventuell eine andere Amplitude oder einen anderen Phasengang. Vielmehr werden auch Gruppenlaufzeitverzerrungen und insbesondere das zeitliche Verhalten, wie beispielsweise Nachhall und andere hier beschriebene Phänomene, berücksichtigt.
  • Ein frequenzveränderliches, exponentiell ansteigendes Sinus-Eingangssignal X(t) kann beispielsweise durch die folgende Formel wiedergegeben werden: X ( t ) = s i n [ 2 π f 1 T l n ( f 2 f 1 ) ( e t T l n ( f 2 f 1 ) 1 ) ]
    Figure DE102018120229A1_0003
  • Die Frequenz f1 und f2 umfasst vorzugsweise das hörbare Frequenzspektrum, beispielsweise ist f1 zwischen 10 und 500 Hz und f2 zwischen 10 und 30 kHz.
  • Um eine zeitabhängige Nachbearbeitung überhaupt erst zu ermöglichen, ist es bevorzugt, dass die Positionen und Aufstellwinkel des bzw. der Testlautsprecher und der Mikrofone derart adjustiert werden, dass mehrere Impulsantwortkanäle zumindest annährend den gleichen zeitlichen Ursprung haben. Das bedeutet, dass die Positionen und Ausrichtung der Lautsprecher und Mikrofone so exakt sind, dass die Laufzeitdifferenzen beispielsweise sich im Bereich von < 0,5 ms, insbesondere < 0,2 ms, bevorzugt < 0,1 ms belaufen. (Eine Laufzeit von 1 ms entspricht etwa einer Distanz von 34 cm). Im Bereich weniger Samples lassen sich die Laufzeitunterschiede noch elektronisch durch Nachbearbeitung der Impulsantworten ausgleichen, ansonsten führen sie zu einer Links-/Rechtsverschiebung. Dies kann beispielsweise wie folgt geschehen: Wird zum Beispiel mit einem Kunstkopf aufgenommen, wird der Abstand zwischen dem linken Lautsprecher zum linken Ohr exakt mit dem Abstand vom rechten Lautsprecher zum rechten Ohr abgeglichen, z.B. mit einem Laser-Entfernungsmesser. Darüber hinaus werden die Winkel der Lautsprecher (z.B. ein Paar Stereolautsprecher) auf innerhalb 5° exakt eingewinkelt, um ein präzises Stereodreieck zu erreichen und akustisch bedingte Interferenzen zu vermeiden. Insbesondere werden die Lautsprecher in einem akustisch möglichst symmetrischen Raum präzise aufgestellt und eingewinkelt. Die genaue Aufstellung der Lautsprecher kann zum Beispiel wie folgt getestet werden: Zunächst werden die Stellplätze ausgemessen und - wenn mit zwei Mikrofonen gemessen wird - die 2x2-Impulsantwortkanäle Ill , Irl , Ilr und Irr dargestellt und angeschaut. Dabei wird darauf geachtet, dass diese den gleichen zeitlichen Ursprung haben, d. h. dass der Direktschall zum gleichen Zeitpunkt eintrifft. Im Rahmen von wenigen (z.B. bis zu 10) Samples kann dann eine elektronische Korrektur vorgenommen werden, indem der Ursprung der Impulsantwortkanäle verschoben wird. Ist dies jedoch mehr, müssen die Lautsprecher verschoben werden. Wegen möglicher Interferenzen muss das Einwinkeln penibel sein.
  • Gemäß einer vorteilhaften Ausführungsform der Erfindung wird bei der Nachbearbeitung die Übertragungsfunktion des Raumes berücksichtigt. Insbesondere wird dies für die typischen „Raummoden“ durchgeführt: Dies bezeichnet das Phänomen, dass bestimmte Frequenzen, zumeist im Basstonbereich, in kleinen Räumen stehende Wellen bilden und daher sehr langsam ausklingen. Dies kann die geringere Tieftonwiedergabe kleinerer Lautsprecher kaschieren, was sie im direkten Vergleich mit größeren Lautsprechern im Bassbereich zu günstig abschneiden lässt. Gemäß einer Ausführungsform der Erfindung wird die Impulsantwort daher dadurch nachbearbeitet, dass eine oder mehrere raumabhängige Frequenzen nach einer Nachhallgrenze ausgeblendet werden. Die Nachhallgrenze liegt beispielsweise bei 200 bis 500 ms, z. B. zwischen 350 und 450 ms. Nach dieser Zeit wird die Impulsantwort durch ein Fade-out moduliert, also langsam ausgeblendet bzw. zu späteren Zeiten zunehmend gedämpft. Dies geschieht in vorteilhaften Ausführungsformen nicht über das gesamte Signal, sondern lediglich in den Frequenzbereichen der Raumresonanzen (Raummoden) des Aufnahmeraumes, beispielsweise bei 50 Hz, oder auch bei mehreren raumabhängigen Frequenzen. Alternativ kann das Fade-out auch frequenzunabhängig durchgeführt werden. Ferner kann statt eines Fade-Outs auch ein zeitabhängiges Filter verwendet werden.
  • Diese und andere Nachbearbeitung(en) wird/werden typischerweise empirisch ermittelt, z.B. wird in einem bestimmten Aufnahmeraum das erfindungsgemäße Verfahren durchgeführt und die durch Entfaltung (vor der Nachbearbeitung) ermittelte Impulsantwort wird zeit- und frequenzabhängig dargestellt, vorzugsweise in einer Spektrogrammdarstellung. Dies ist eine Darstellung der Signalhöhe (z.B. Pegelhöhe in dB) der Impulsantwort, aufgelöst nach Frequenz und Zeit. Dies kann beispielsweise durch ein „Pegelgebirge“ erfolgen, wie beispielsweise in 2 wiedergegeben. Eine andere Darstellungsweise, z.B. mit Grautönen oder Falschfarben oder mit Isobarenlinien, die die Pegelhöhe nach Zeit und Frequenz aufgelöst anzeigen, ist auch möglich. Eine visuelle Analyse der Impulsantwort erlaubt eine Sichtbarmachung von Pegeleinbrüchen und anderen nachbearbeitungsbedürftigen Besonderheiten der Impulsantwort, die ggf. durch den Aufnahmeraum und/oder das Mikrofon-Setup entstehen.
  • Daraus ergibt sich zum Beispiel visuell, wenn bestimmte Frequenzen auch nach 1000 bis 1500 ms noch nicht verklungen sind, in dem gezeigten Beispiel ist eine Raummode bei 39,6 Hz zu sehen. Ebenfalls ergeben sich auch die Nachhalleigenschaften der anderen Frequenzen. Auf diese Weise ist es möglich, Raumresonanzen zu erkennen und diese mit einer bestimmten Nachhallgrenze gezielt elektronisch auszublenden. Alternativ ist es natürlich auch möglich, den Aufnahmeraum akustisch zu bedämpfen, beispielsweise mit einem Helmholtz-Resonator. Die elektronische Nachbearbeitung der Impulsantwort ist jedoch die bevorzugte, da einfachere Lösung.
  • Für die zeitabhängige Nachbearbeitung der Impulsantwort ist zudem ein gutes Verständnis der typischen Raumakustik und dessen Wahrnehmung durch das menschliche Gehör von Bedeutung: Befindet sich ein Hörer in einem Raum und tauscht einer Schallquelle, so erreicht ihn zuerst der sogenannte Direktschall, auch Freifeld genannt, also die Schallwellen, die sich direkt und ohne Reflektionen von der Schallquelle zum Hörer ausgebreitet haben. Kurz danach treffen die sogenannten frühen Reflektionen ein, beispielsweise die vom Boden und/oder der Decke einmal reflektierten Schallwellen. In einem kleinen Raum treffen die ersten Reflexionen in einem relativ hohen Pegel nach einer kurzen sogenannten Anfangszeitlücke ein. Noch später erreichen den Hörer die mehrfach reflektierten bzw. gebrochenen Schallwellen, welche man dann als „Diffusfeld“, „diffuses Schallfeld“ bzw. „Raumschallfeld“ bezeichnet.
  • Die Erfindung hat in einer bevorzugten Ausführungsform erkannt, dass die sehr frühen Reflexionen bei der Aufnahme einer Impulsantwort problematisch sind und weitestgehend vermieden werden sollten, da Mikrofone nicht über das physiologische Selektions- und Kompensationsvermögen des menschlichen Gehörs verfügen. In anderen Worten ist ein Mensch in der Lage, frühere Reflexionen als solche zu erkennen und auszublenden, während ein Mikrofon dies nicht kann. Für möglichst unverfärbte Aufnahmen sollten daher die für kleine Räume typischen frühen Reflexionsmuster (insbesondere Boden-, Decken- und Seitenreflexionen unterhalb von etwa 5 ms) weitestgehend vermieden werden. Dies wird vorzugsweise zum einen dadurch erreicht, dass der Aufnahmeraum Diffusoren, Absorber und/oder schallabsorbierende Elemente enthält, insbesondere an Fußboden und Decke. Bei dem Absorber kann es sich beispielsweise um einen dicken Teppich handeln, der auf den Boden gelegt wird. Dadurch können die Bodenreflexionen vermieden werden. Andererseits ist es jedoch auch nicht wünschenswert, einen komplett schalltoten Raum zu schaffen, da dies wiederum auch kein realistisches Hörerlebnis schafft. Insbesondere kann in einem schalltoten Raum kein Diffusfeld erzeugt werden, welches jedoch für ein realistisches Hörerlebnis notwendig ist.
  • Ferner umfasst die Nachbearbeitung der Impulsantwort somit in einer bevorzugten Ausführungsform ein Filter, welches, eine Dämpfung der frühen Reflexionen, insbesondere der Erstreflexionen, erreicht. Dazu wird insbesondere im Zeitbereich, falls erforderlich, zwischen 0 und 15 ms, vorzugsweise zwischen 0 und 10 ms, besonders bevorzugt 2 bis 5ms nach Eintreffen des Direktschallanteils, insbesondere nach dessen Maximum, eine exakt definierte, zeitlich begrenzte Pegelsenkung durchgeführt. Diese beträgt beispielsweise 18-22 dB, z.B. 20 dB. Diese Pegelsenkung kann breitbandig, also frequenzunabhängig, oder frequenzselektiv erfolgen.
  • Vorteilhaft wird das bzw. die Filter, mit dem die berechnete Impulsantwort für einen bestimmten Aufnahmeraum nachbearbeitet wird, jeweils empirisch durch Analyse einer berechneten Impulsantwort ermittelt, z.B. um die Raummoden und das Muster der Frühreflexionen zu ermitteln. Dabei kann die Impulsantwort als Spektrogramm visualisiert werden.
  • In einer vorteilhaften Ausführungsform wird das Ausgangssignal an zwei Mikrofonen im Rahmen einer binauralen Tonaufnahme aufgenommen. Dabei handelt es sich bevorzugt um Aufnahmen wie beispielsweise bei Hiekkanen beschrieben, also mit einem Kunstkopf oder sogar im Ohr einer Testperson. Die beiden Mikrofone sind also insbesondere in den beiden Ohren eines Kunstkopfes angeordnet, insbesondere eines kommerziell erhältlichen Kunstkopfes. Als Kunstkopf kann beispielsweise ein Neumann KU100 verwendet werden. Auf binaurale Weise lässt sich das spezifische Schallleistungs-Profil von Lautsprechern in Räumen klanglich besonders authentisch darstellen. Dies gilt sowohl für Echtzeitaufnahmen als auch für die Auralisierung der zu vergleichenden Lautsprecher mittels Impulsantworten, wie in dem erfindungsgemäßen Verfahren.
  • Beispielsweise die Studie von Hiekkanen et al. zeigt, dass binaurale Aufnahmeverfahren bei richtiger Implementierung eine hohe Übereinstimmung von realer Situation und zugehörigem Hörereignis ermöglichen. Dies gilt jedoch nur für einen eingeschränkten Frequenzbereich bis etwa 4 kHz. Bei breitbandigeren Signalen hingegen, z. B. Tonmaterial mit perkussivem Charakter, stellen sich hörbare spektrale Verfärbungen ein. Das gilt auch dann, wenn zur genaueren Entzerrung der Übertragungsfunktionen personalisierte Außen-Übertragungsfunktionen verwendet werden.
  • Hierzu ist Folgendes zu beachten: Im Freifeld trifft der Schall direkt aus der Richtung der Schallquelle auf das Ohr bzw. das Mikrofon, im Gegensatz zum Diffusfeld, bei dem der Schall aus allen Richtungen gleichmäßig auf das Ohr bzw. auf die Membran fällt. Befindet man sich nah an der Schallquelle, überwiegt der Direktschall. Befindet sich der Hörer in großem Abstand von der Schallquelle, überwiegend das Diffusfeld. Die Grenze zwischen Freifeld und Diffusfeld wird als Hallradius bezeichnet.
  • Aufgrund der unterschiedlichen Einfallrichtungen von Freifeld und Diffusfeld auf die Membran eines Mikrofons ergeben sich für die beiden Schallfelder (Freifeld und Diffusfeld) unterschiedliche Frequenzgänge, d.h. die verschiedenen Frequenzen werden durch das Mikrofon unterschiedlich stark verstärkt oder gedämpft. Um dieses Phänomen auszugleichen, sind Mikrofone, insbesondere Kunstkopf-Mikrofone, automatisch für ein bestimmtes Schallfeld entzerrt. Die Freifeldentzerrung ist beispielsweise eine Linearisierung des Frequenzganges eines Druckmikrofons, das sich im freien Schallfeld befindet. Die Diffusfeldentzerrung hingegen ist eine Linearisierung des Frequenzganges eines Druckmikrofons, das sich im Diffusfeld befindet. Da bei üblichen Tonaufnahmen in einem Konzert Diffusfeldbedingungen herrschen, ist ein Kunstkopf-Mikrofon typischerweise diffusfeldentzerrt. Bei Lautsprecherwiedergaben in üblichen, akustisch gedämpften Wohnräumen herrscht jedoch weder die reine Freifeld-, noch die reine Diffusfeldbedingung vor. Sowohl der Zuhörer als auch der an seine Stelle tretende Kunstkopf befinden sich zwar meist außerhalb des Hallradius', jedoch nur knapp, und damit nicht vorwiegend im Diffusfeld. Die Direktschallanteile sind stets noch zu berücksichtigen.
  • Unter einer Außenohr-Übertragungsfunktion (Head-related Transfer Function, HRTF) bezeichnet man die anatomische Übertragungsfunktion des Ohres, welche kennzeichnet, wie ein Ohr Schall von einem bestimmten Punkt im Raum aufnimmt. Die Richtung, aus der der Schall auf das Ohr auftrifft, die Größe und Form des Kopfes wie auch der Ohrmuschel, des Gehörkanals, ebenso wie auch die Größe und Form der Hohlräume des Außenohrs, beeinflussen den Schall und wie er wahrgenommen wird, insbesondere werden einige Frequenzen verstärkt und andere geschwächt. Dies variiert stark von Person zu Person. Die Faltung einer Schallquelle mit der kopfbezogenen Impulsantwort (Head-related Impulse Response, HRIR) wandelt den Schall um in das, was der Zuhörer gehört haben würde (siehe Wikipedia Artikel „Head-related Transfer Function“).
  • Wie oben erwähnt, wird das erfinderische Verfahren bevorzugt durch binaurale Tonaufnahmen - insbesondere mit einem Kunstkopf-Mikrofon - durchgeführt. Dabei stellen sich jedoch hörbare spektrale Verfärbungen ein, wenn die so gewonnene Impulsantwort mit Musik gefaltet und über einen Kopfhörer abgehört wird. Insbesondere kommen Zischlaute undifferenziert und lispelnd, was dem Klangbild einen leicht wattigen Charakter gibt. Im Vergleich zur realen Lautsprecherwiedergabe fehlt Artikulationsschärfe. Dieser Eindruck zeigt sich mit unterschiedlichen Kopfhörern mal mehr, mal weniger ausgeprägt, ist jedoch stets vorhanden. Nach eingehender Analyse lassen sich vier potenzielle Problemfelder abstecken:
    1. 1. Die integrierte Entzerrung des Kunstkopf-Mikrofons (hier verwendet: Neumann KU100; diffusfeldentzerrt) entspricht nur bedingt den herrschenden, akustischen Rahmenbedingungen beim Aufnehmen von Lautsprechern in Wohnräumen oder Kraftfahrzeugen.
    2. 2. Selbst schmalbandige Pegeleinbrüche im Hochtonfrequenzgang des benutzten Kopfhörers wirken sich mindernd auf die Klangqualität binauraler Aufnahmen aus, sobald sie spektral ungünstig auftreten.
    3. 3. Die Schnittstelle Kopfhörer-Ohrmuschel zeigt sich kritisch hinsichtlich ihrer akustischen Anpassung.
    4. 4. Akustische Schwachstellen im Aufnahmeraum äußern sich bei Mikrofonaufnahmen stärker als beim realen Hörerlebnis.
  • Dieser Betrachtung liegt folgendes Modell zugrunde: Die gemessene Impulsantwort ist eine Zusammenfassung der Übertragungsfunktionen des Kunstkopf-Mikrofons, des verwendeten Kopfhörers sowie des Ohrs des Hörers. Da Kunstkopf-Mikrofone in der Regel im Diffusfeld verwendet werden, haben diese in der Regel bereits eine Diffusfeldentzerrung integriert.
  • Bedingt durch ihre statische Wirkweise kann die übliche Frequenzgang-Entzerrung von Mikrofonen nur einen einzigen Zustand im Schallfeld exakt kompensieren. Diese kann zwar beliebigen Situationen einschließlich und zwischen den beiden Extremfällen Freifeld und Diffusfeld entsprechen, ist jedoch prinzipbedingt nicht veränderlich. Erfordern beispielsweise frontal einfallende Schallquellen mit geringem Abstand eine Freifeldentzerrung, so werden die aus anderen Richtungen einfallenden Schallanteile nicht korrekt entzerrt (z. B. späte Raumreflexionen oder Raumhall). Soll hingegen das diffuse Schallfeld richtungsneutral dargestellt werden, so entstehen mit der hierfür notwendigen Diffusfeldentzerrung bei allen richtungsgebunden einfallenden Schallquellen mehr oder wenige große Frequenzgangfehler.
  • Da die in den Kunstkopf integrierte Diffusfeldentzerrung nicht den Bedingungen der Lautsprecherwiedergabe in üblichen, akustisch gedämpften Wohnräumen entspricht, wurde zunächst untersucht, ob sich die beschriebenen spektralen Verfärbungen mit einem statisch wirkenden Korrekturfilter ausgleichen lassen. Dies wurde auf empirischen Wege ermittelt. Hierzu dienten vergleichende Hörtests eines per binauraler Impulsantwort (BRIR) auralisierten Lautsprechersets gegenüber demselben Lautsprecherset im realen Aufnahmeraum. Abgehört wurde dabei mit verschiedenen Kopfhörern. Als Testsignal wurde rosa Rauschen verwendet, welches sich als besonders kritisch hinsichtlich spektraler Verfärbungen erwies.
  • Dadurch wurde eine Equalizer-Einstellung ermittelt, welche in 3 dargestellt ist. Diese zeigt drei Bandfilter (1, 2, und 3) an, mit jeweils einem bestimmten Gain (Verstärkung/Dämpfung) in dB, einer Mittenfrequenz in Hz und einer Güte (Bandbreite) Q. Der Verlauf der empirisch ermittelten Filterkurve erlaubte Rückschlüsse auf die möglichen Ursachen für die spektralen Verfärbungen. So zeigten Mittenfrequenz und Anhebung aller drei verwendeten Bandfilter eindeutigen Bezug zu Kopfhörer- sowie Kunstkopf-spezifischen Merkmalen. Das Korrekturfilter beinhaltete eine leichte Verstärkung bei 2,5 kHz, entsprechend einer typischen Ohrkanal-Resonanz, sowie bei 3,6 kHz, entsprechend einer typischen Ohrhöhlen (Concha-)-Resonanz. Schließlich wurde bei 8 kHz entsprechend einer typischen destruktiven Interferenz durch Concha-Reflexion mit 8 dB verstärkt.
  • Durch dieses Filter war ein realistischeres, im Hochtonbereich jedoch leicht überspitztes Klangergebnis erzielbar. Die spektralen Untersuchungen des aufgezeichneten Tonmaterials (Impulsantworten) bestätigen die empirisch ermittelte Filtereinstellung. So zeigte sich der selektive Frequenzgangeinbruch (Interferenz durch Concha-Höhlen-Reflexion) beim verwendeten Kunstkopf-Mikrofon bei etwa 7,5 kHz. Dies ist in 4 dargestellt. Die 4 zeigt eine spektrale Darstellung des Testsignals bei Pink Noise, aufgezeichnet mit Kunstkopf-Mikrofon Neumann KU100. Gut zu erkennen ist der Pegeleinbruch im Frequenzbereich zwischen 7 und 8 kHz, hervorgerufen durch destruktive Interferenz in der Concha-Höhle, bei einer Schalleinfallseinrichtung von 0° Azimut und 0° Elevation. Dies wird mitunter auch als „Pinna Notch“ bezeichnet. Damit fällt jedoch dieser Frequenzgangeinbruch des Kunstkopf-Mikrofons genau in denjenigen spektralen Bereich, in dem auch bei Kopfhörern erhebliche Unregelmäßigkeiten auftreten. Wie Messungen verschiedener Kopfhörer zeigten, ist bei ihnen meist ebenfalls mit schmalbandigen Einbrüchen zwischen 7 bis 10 kHz zu rechnen. Je nach verwendetem Kopfhörer kann es daher im Verbund mit dem Kunstkopf-Mikrofon zu drastischen Pegelsenken kommen, die darüber hinaus auch noch abhängig von der Außenohr-Anatomie des Benutzers sowie der Positionierung des Kopfhörers sind. Ein weiterer Unsicherheitsfaktor ist, dass die beschriebene Concha-bedingte Interferenz bei Kunstkopf-Mikrofonen je nach Ausführung der verbauten Pinnae zwischen 7 und 10 kHz auftreten kann.
  • Eine exakte Kompensation des Pinna Notch ist damit einzig über die individuelle HRTF-Erstellung möglich. Diese muss die Übertragungsfunktionen von Kunstkopf-Mikrofon, Kopfhörer und Pinna mit einbeziehen, was sie aufgrund der schmalbandig wirkenden Filter extrem anfällig für Toleranzen macht. Dies ist aus praktischen Gründen für das hier beschriebene System zum Lautsprecher-Vergleich nicht durchführbar.
  • Die Lösung für dieses Problem liegt in einer dynamischen (zeitabhängigen) Entzerrung (Time-Windowed Equalization). Und zwar wurde ein Korrekturfilter eingesetzt, welcher nicht mehr statisch über die gesamte Dauer des Audiosignals arbeitet, sondern gezielt innerhalb definierter, spektral wichtiger Zeitbereiche. Gemäß dieser bevorzugten Ausführungsform gleicht die zeitabhängige Entzerrung bzw. das Filter eine in den Kunstkopf integrierte Diffusfeldentzerrung durch eine Freifeld-orientierte Entzerrung der Impulsantwort innerhalb eines frühen Zeitfensters aus, insbesondere innerhalb eines Zeitfensters bis zu 40ms, bevorzugt bis zu 30ms, besonders bevorzugt bis zu 18ms nach dem zeitlichen Ursprung der Impulsantwort, also nach dem Eintreffen des Direktschallanteils. In anderen Worten: Bei Aufnahmen mit einem kommerziellen Kunstkopf wird das Ausgangssignal in der Regel automatisch diffusfeldentzerrt, da der Kunstkopf für Aufnahmen z.B. in Konzertsälen im Diffusfeld konzipiert wird. Diese Entzerrung führt zu unerwünschten Änderungen in der Impulsantwort, wenn der Kunstkopf erfindungsgemäß eingesetzt wird, also z.B. einem Wohnraum, z.B. zu Einbrüchen zwischen 7 bis 10 kHz. Dies wird durch eine Freifeld-orientierte Entzerrung kompensiert, die die integrierte Diffusfeld-Entzerrung zumindest teilweise wieder ausgleicht, aber nur innerhalb eines frühen Zeitfensters bis 60ms, bevorzugt bis zu 40ms, nach Aufnahmebeginn. Die Klanganteile des Impulsantwort, die dem Diffusfeld entsprechen, bleiben diffusfeldentzerrt.
  • Insbesondere wurde erkannt, dass der Pinna Notch dadurch kompensiert werden kann, dass die frontal eintreffenden Schallanteile beim Kunstkopf-Mikrofon nach Freifeld-Bedingungen entzerrt werden. Das bedeutet, dass die Diffusfeldentzerrung des Kunstkopfes für Signalanteile der Impulsantwort innerhalb eines frühen Zeitfensters ausgeglichen wird, beispielsweise für das Zeitfenster eines Zeitfensters bis zu 40ms, bevorzugt bis zu 30ms, besonders bevorzugt bis zu 18ms nach Eintreffen des Direktschallanteils.
  • Gemäß einer bevorzugten Ausführungsform wird die Impulsantwort durch eine Pegelanhebung im Bereich des Pinna-Notch, insbesondere zwischen 6 und 9 kHz nachbearbeitet. Die Pegelanhebung findet insbesondere in einem Fenster im Zeit- und Frequenzbereich, insbesondere mit einer Fensterfunktion mit abgerundeten Flanken statt, wie oben erwähnt. Beispielsweise beträgt die Pegelanhebung zwischen 7 und 13 dB, bevorzugt zwischen 8 und 12dB.
  • Auf Basis der in der spektralen Auswertung (4) ermittelten Senke im Amplitudenfrequenzgang des Kunstkopf-Mikrofons wurde beispielhaft ein Freifeld-Korrekturfilter erstellt. Beispielsweise hatte dieser eine Mittenfrequenz fm = 7,5 kHz; a = +10 dB; Q = 2,5. Um die Korrekturwirkung auf den minimalphasigen Anteil zu beschränken, wird vorzugsweise ein IIR-Bandfilter verwendet.
  • Wenn dieses Filter jedoch nicht dynamisch, sondern für den gesamten Zeitbereich verwendet wurden, stellte sich bei diffusen Schallanteilen wie beispielsweise ausklingenden Hallfahnen ein artifizieller Beigeschmack ein. Ursache hierfür war die modifizierte, für Diffusschall nun nicht mehr optimal angepasste Entzerrung. Im Übrigen zeigte der Korrekturfilter jedoch eine deutlich hörbare, positive Wirkung. Insbesondere zeigte sich dies in der Einschwingphase komplexer, transientenreicher Signale wie Becken, gezupfte Gitarrenseiten. Ferner verbesserte sich die Artikulationsschärfe. Bei anderen Kunstkopf-Mikrofonen können die einzustellenden Filterparameter anders ausfallen.
  • Für die dynamische Entzerrung werden für die zu bearbeitenden, zeitlichen Bereiche der Impulsantwort Zeitfenster definiert, in denen das Korrekturfilter wirksam ist. Das hierfür notwendige Editieren der Impulsantworten kann somit nach dem Aufnahmevorgang erfolgen (Nachbearbeitung bzw. Post-Processing). Auf diesem Wege lassen sich auch in zeitlicher Hinsicht exakt definierte und sehr präzise Entzerrungsvorgänge realisieren. Mit der beschriebenen Ausführungsform wird für die zuerst und vorwiegend frontal eintreffenden Schallanteile eine Freifeldentzerrung durchgeführt, während sich für das später einstellende, umgebende Schallfeld die im Kunstkopf-Mikrofon realisierte Diffusfeldentzerrung als vorteilhafter erweist.
  • In der Praxis erfolgt diese „pinna notch“-Korrektur der binauralen Impulsantworten (BRIRs) nach folgendem Schema: Um die Direktschallanteile des Lautsprechers möglichst verfärbungsfrei zu übermitteln, wird der Startzeitpunkt zur Freifeldentzerrung kurz vor das Einsetzen der initialen Impulsflanke (Peak) gelegt. Ein Zeitfenster von insgesamt etwa 10 bis 25 ms ist erforderlich, um neben dem Direktschall auch die erwünschten Erstschallreflexionen (≥ 6 ms) der Seitenwände im Raum zu erfassen und in die Freifeldentzerrung miteinzubeziehen - Ihre spektrale Färbung ist mitbestimmend für die wahrgenommene Klangqualität von Lautsprechern. Nach der Freifeld-entzerrten Zeitspanne erfolgt dann der gefensterte Übergang zur normalen Diffusfeldentzerrung.
  • Gemäß einer weiteren bevorzugten Ausführungsform wird eine Frequenzgangkorrektur der Gehörgang- und/oder der Concha-Resonanz durchgeführt. Vorzugsweise hängt deren Ausmaß primär von den Übertragungseigenschaften sowie der akustischen Ankopplung (akustische Impedanz) des verwendeten Kopfhörers ab. Vorzugsweise kommt hierfür ein free air equivalent coupling (FEC) Kopfhörer wie etwa ein STAX SR-L300 oder ein Sennheiser HD 800 S zur Anwendung. Auch lassen sich mit dieser Frequenzgangkorrektur eventuelle Entzerrungsungenauigkeiten des verwendeten Kunstkopf-Mikrofons ausgleichen.
  • Gemäß einer bevorzugten Ausführungsform umfasst die Nachbearbeitung ein Filter zur Korrektur der Concha-Resonanz, insbesondere eine Pegelanhebung oder - senkung mit einer Mittenfrequenz zwischen 3 kHz und 5 kHz, z.B. bei etwa 3,6 kHz, z.B. um ca. 0,5 bis 5 dB. Dieses Filter muss nicht zeitgefenstert sein. Daher muss es auch nicht auf die Impulsantwort angewendet werden, sondern kann erst beim Abspielen eines gefalteten Audiosignals angewendet werden.
  • Gemäß einer bevorzugten Ausführungsform umfasst die Nachbearbeitung ferner ein Filter zur Korrektur der Ohrkanal-Resonanz, insbesondere eine Pegelanhebung oder -senkung mit einer Mittenfrequenz zwischen 2 kHz und 3 kHz, z.B. bei 2,5kHz, z.B. um ca. 0,5 bis 3 dB. Dieses Filter muss nicht zeitgefenstert werden. Daher muss es auch nicht auf die Impulsantwort angewendet werden, sondern kann erst beim Abspielen eines gefalteten Audiosignals angewendet werden.
  • Gemäß einer weiteren bevorzugten Ausführungsform wird beim Abspielen des vorbestimmten Eingangssignals ein D/A Wandler mit IIR-basierten Digitalfiltern verwendet. IIR (Infinite Impulse Response)- basierte Digitalfilter weisen kein Pre-Ringing auf und vermeiden damit Fehlinterpretationen der Einschwingvorgänge (z. B. bei der initialen Flanke der Impulsantwort).
  • Die Erfindung ist auch auf eine erfindungsgemäß gewonnene Impulsantwort sowie eine entsprechende Übertragungsfunktion gerichtet.
  • Die Erfindung ist ferner auf ein Verfahren zum Nachbearbeiten einer Impulsantwort eines Lautsprechers oder einer anderen breitbandigen Schallquelle gerichtet, bei welchem die Impulsantwort wie hier beschrieben nachbearbeitet wird. Die Impulsantwort kann auf bekannte Weise gewonnen worden sein. Insbesondere wird die Impulsantwort mittels eines oder mehrere Filtern bzw. Equalizern nachbearbeitet. In einigen Ausführungsformen werden bestimmte Filter nur in bestimmten Zeitfenstern angewendet. Dabei wird vorzugsweise zwischen Freifeld (z.B. bis zu 10ms-40ms nach Eintreffen des Direktschallanteils und Diffusfeld (z.B. von 40ms bis 500ms nach Eintreffen des Direktschallanteils) unterschieden, d.h. es werden in einigen Ausführungsformen verschiedene Filter auf den dem Freifeld entsprechenden Zeitabschnitt der Impulsantwort und auf den dem Diffusfeld entsprechenden Zeitabschnitt angewendet.
  • Die Erfindung ist auch auf ein Verfahren zum Testen von Lautsprechern oder anderen breitbandigen Schallquellen gerichtet, mit den folgenden Schritten:
    • • Bereitstellen einer Impulsantwort eines Testlautsprechers, welche insbesondere gemäß der Erfindung erzeugt wurde,
    • • Bereitstellen eines (beliebigen) Audiosignals;
    • • Falten des Audiosignals mit der Impulsantwort des Testlautsprechers und
    • • Ausgeben des gefalteten Audiosignals, insbesondere über einen Kopfhörer.
  • Das Verfahren ist vorteilhaft in einem Computerprogramm, auch Software-Player genannt, implementiert, welches Softwarecode-Abschnitte enthält, die es einem Prozessor erlauben, das Verfahren auszuführen. Der Prozessor ist vorteilhaft Teil eines PC's, eines lokalen Servers, eines Remote-Servers, eines Cloud-Computers, eines Tablets, Laptops oder eines anderen tragbaren Computers, oder eines tragbaren Devices, z.B. eines Smartphones. Insbesondere ist das Computerprogramm als App implementiert.
  • Das Verfahren erlaubt es, auf einfache Weise einen Lautsprecher oder ein Musikinstrument probezuhören, ohne dass diese physisch vorhanden sein müssen. Dabei ist es von Vorteil, wenn das zum Abhören verwendete Audiosignal in einer normalisierten Lautstärke bereitgestellt wird, beispielsweise mit -23 LUFS nach EBU R 128. Alternativ ist auch eine im Software-Player integrierte fixe Pegelabsenkung der eingelesenen Musikfiles (Audiosignals) von etwa 6 - 12 dB möglich. Dies hat den Vorteil, dass mögliche Frequenzgangpeaks der getesteten Lautsprecher, die bedingt durch allfällige Raummoden speziell im Bassbereich auftreten können, nach der Faltung nicht zu Verzerrungen durch Übersteuerung führen können.
  • Vorteilhaft werden mehrere Impulsantworten verschiedener Testlautsprecher oder Schallquellen bereitgestellt, wobei während der Ausgabe des gefalteten Audiosignals die zur Faltung verwendete Impulsantwort in Echtzeit umschaltbar ist. In andere Worten kann der Benutzer der Software die zu verschiedenen Lautsprechern gehörigen Impulsantworten während des Hörens wechseln, wobei die Software den Wechsel in Echtzeit bzw. mit einem minimalen Delay von z.B. weniger als 1 sec, bevorzugt weniger als 200ms, nachvollzieht. Dadurch können verschiedene Lautsprecher unmittelbar verglichen werden.
  • Gemäß einer vorteilhaften Ausführungsform ist das Computerprogramm derart ausgestaltet, dass der Schritt des Faltens des Audiosignals mit einer Impulsantwort gleichzeitig mit zwei oder mehr verschiedenen Impulsantworten durchgeführt wird. Es wird jedoch stets nur ein gefaltetes Audiosignal ausgegeben. Dies dient dazu, dass tatsächlich ohne Zeitverzögerung von einer Impulsantwort (also einer Testlautsprecher-Anordnung) zu einer zweiten Impulsantwort (also einer zweiten Testlautsprecher-Anordnung) umgeschaltet werden kann. Umgesetzt wird dies vorzugsweise mit zwei oder mehr Convolution-engines, welche in dem Software-Player parallel arbeiten. Die entsprechenden Impulsantworten werden vorher hochgeladen. Wenn von „Impulsantwort“ die Rede ist, sind natürlich auch Impulsantworten mit mehreren Kanälen gemeint, z.B. 2x2.
  • Nicht zwingend zeitgefensterte Entzerrungsmaßnahmen, beispielsweise die Ear-Gain-Kompensation im Frequenzbereich zwischen 2 und 5 kHz zur optimalen Anpassung der wiedergebenden Kopfhörer, müssen nicht in die Impulsantwort hineingearbeitet sein (wie oben bereits erwähnt). Vielmehr können diese bevorzugt auch Bestandteil des Verfahren zum Testen von Lautsprechern bzw. des Computerprogramms sein - sowohl fix, also auch variabel (auswählbar). Diese Aufteilung ermöglicht eine höhere Flexibilität auf der Wiedergabeseite beim Kunden (z.B. bei der Auswahl der Kopfhörer), da die Impulsantwort nicht nachträglich an den verwendeten Kopfhörer angepasst werden muss.
  • In einer bevorzugten Ausführungsform umfasst das Verfahren zum Testen von Lautsprechern daher einen Schritt, in welchem das gefalteten Audiosignals entzerrt wird, insbesondere beim bzw. kurz vor dem Ausgeben über einen Lautsprecher, insbesondere einen Kopfhörer. Diese Entzerrung kann naturgemäß nicht zeitabhängig sein, im Übrigen kann sie wie oben beschrieben durch ein oder mehrere Filter realisiert werden. In einer besonders bevorzugten Ausführungsform beinhaltet das Computerprogramm eine Auswahl von mehreren verschiedenen Entzerrungs-Optionen, welche jeweils an einen bestimmten Ausgabelautsprecher oder -kopfhörer angepasst sind. Der Benutzer kann dann die seinem Lautsprecher/Kopfhörer entsprechende Entzerrungs-Option auswählen und diese Entzerrung wird dann bei der Ausgabe auf das gefaltete Audiosignal angewendet.
  • Gemäß einem weiteren Aspekt der Erfindung ist diese auch auf ein digitales Speichermedium gerichtet, auf dem das erfindungsgemäße Computerprogramm abgespeichert ist. Dabei kann es sich um ein beliebiges computerlesbares Medium handeln, z.B. eine Festplatte, ein optisches Speichermedium wie CD-ROM, magnetisches Speichermedium, ein festkörperbasiertes Speichermedium, eine SSD-Card, ein USB-Stick etc. Das Speichermedium kann lokal oder über ein Netzwerk verfügbar sein, insbesondere kann es auch eine Cloud sein, oder Teil eines Computers oder mobilen Geräts.
  • Gemäß einem weiteren Aspekt ist die Erfindung auch auf ein Audiosignal bzw. Audiofile gerichtet, welches mit einer erfindungsgemäßen Impulsantwort eines Testlautsprechers gefaltet wurde. Dies ermöglicht, dass die Vorteile der Erfindung genutzt werden können, ohne die rechenaufwendige Faltung eines beliebigen Audiosignals durchführen zu müssen. Vielmehr kann man die Impulsantworten verschiedener Testlautsprecher (oder Kraftfahrzeuge bzw. Kraftfahrzeug-Lautsprecheranlagen) beschaffen und damit verschiedene Audiosignale falten, bspw. könnte man Beispiel-Musikstücke bzw. Audiofiles aus verschiedenen Musikbereichen (Jazz, Pop, Klassik) falten und potenziellen Kunden bereitstellen, bspw. zum Herunterladen auf einer Website, insbesondere einer Musikbörse. Dadurch ist es möglich, eine Musikbibliothek mit vorgefalteten Musikstücken/Audiofiles bereitzustellen, welche z.B. mit dem oben beschriebenen Software-Player gerendert wurden. Dies hat den Vorteil, dass auf Kundenseite keine große Rechenleistung bereitgestellt werden muss und die Kunden dennoch mit einer Auswahl von Musikstücken verschiedene Testlautsprecher testen können. Das Audiofile kann in beliebigen handelsüblichen Formaten bereitgestellt werden, z.B. in einem RIFF-WAVE Format, in einem AIFF (Audio Interchange File Format), einem FLAC (Free Lossless Audio Codec), als MP3 oder einem anderen gebräuchlichen Datenformat.
  • Sowohl die zur Faltung herangezogenen Impulsantworten als auch pre-gerenderte Audiofiles können auch in einem digitalen Containerformat gemeinsam mit weiteren Daten, z.B. mit Bildern, z.B. der Testlautsprecher) geliefert werden. Dabei kann es sich um ein geschütztes/proprietäres Dateiformat handeln. Das oder die Bilder können ggf. während des Ausgebens angezeigt werden, damit der Benutzer auch eine visuelle Bezugsgröße hat.
  • Die Erfindung kann auch ein Head-Tracking beinhalten. Dies bedeutet, dass beim Abspielen/Ausgeben des gefalteten Audiosignals auf Kopfhörern die Kopfposition des Hörers getrackt wird, und das ausgegebenen Audiosignal entsprechend angepasst wird, damit der Hörer den Eindruck bekommt, er bewege sich vor den im Raum aufgestellten Testlautsprechern. Vorzugsweise erfolgt dieser Tracking-Vorgang innerhalb der Player-Software. Dazu wird das gefaltete, binaurale Tonmaterial abhängig von der Position des Head-Tracking-Sensors mit den differentiellen, von der ursprünglichen Bezugsachse (0 Grad Azimut, 0 Grad Elevation) abweichenden HRTFs mittels eines (zuschaltbaren) Binaural-Prozesor-Softwareabschnitts verrechnet.
  • Alternativ hierzu kann die binaurale Impulsantwort mehrmals aufgenommen werden, wobei die Mikrofon-Anordnung, vorzugsweise ein Kunstkopf, zwischen den einzelnen Aufnahmen gedreht wird, um die unterschiedlichen Schalleinfallsrichtungen zu berücksichtigen. So erhält man eine Mehrfach-Impulsantwort aus verschiedenen Richtungen. Beim Abspielen des gefalteten Audiosignals wird dann die Richtung des Kopfhörers, z.B. per Infrarot, getrackt und die jeweilige Impulsantwort verwendet. In beiden Fällen können die einzelnen Kanäle der Mehrfach-Impulsantwort wie hier beschrieben nachbearbeitet werden.
  • Figurenliste
  • Die Erfindung wird nun anhand von Ausführungsbeispielen mit Bezug auf die beiliegenden Zeichnungen näher erläutert. In den Figuren zeigen:
    • 1 Eine schematische Ansicht der Übertragungswege bei einem Hörtest von Stereo-Lautsprechern (aus: Timo Hiekkanen, Aki Mäkivirta und Matti Karjalainen: „Virtualized Listening Tests for Loudspeakers“, J. Audio Eng. Soc., Vol. 57, Nr. 4, April 2009).
    • 2 Eine Darstellung einer Impulsantwort als Pegelgebirge, mit der Frequenz auf der Abszisse, der Zeit auf der Applikate und die Signalhöhe in dB auf der Ordinate.
    • 3 Parameter-Einstellungen für ein Korrekturfilter zur Entzerrung eines Kunstkopf-Mikrophons.
    • 4 Eine spektrale Darstellung in Signalamplitude vs. Frequenz Testsignal Pink Noise -20dBFS, aufgezeichnet mit Kunstkopf (KK)-Mikrofon Neumann KU 100. Gut zu erkennen der Pegeleinbruch im Frequenzbereich zwischen 7 - 8 kHz, hervorgerufen durch destruktive Interferenz in der Concha-Höhle. (Schalleinfallsrichtung: 0 Grad Azimut; 0 Grad Elevation)
    • 5 Spektrale Darstellung der Pegelstruktur einer Impulsantwort, aufgezeichnet mit KK-Mikrofon Neumann KU 100, betrachtet von oben, Zeit auf der Abszisse und Frequenz auf der Ordinate, Signalintensität durch Isobarenlinien dargestellt. Gut zu erkennen der Pegeleinbruch im Frequenzbereich bei etwa 7,5 kHz, hervorgerufen durch destruktive Interferenz in der Concha-Höhle. (Schalleinfallsrichtung: 0 Grad Azimut; 0 Grad Elevation)
    • 6 Spektrale Darstellung einer Impulsantwort (linker Kanal), aufgezeichnet mit KK-Mikrofon Neumann KU 100, betrachtet von oben, Zeit auf der Abszisse und Frequenz auf der Ordinate, Signalintensität durch Isolinien dargestellt.
      1. (A) Definierter, spektraler Arbeitsbereich des Entzerrungsfilters, Filter inaktiv.
      2. (B) Time windowed Equalizing: Hier arbeitet das Filter, wie gefordert, ausschließlich im definierten Zeitabschnitt auf die initiale Impulsflanke bzw. auf den Direktschallanteil, einschließlich frühe Reflexionen, der zu entzerrende Bereich lässt sich durch Bestimmen des Zeitfensters sehr präzise vorgeben. Dabei bleiben die Diffusschallanteile unangetastet.
    • 7 eine Impulsantwort eines Lautsprechers im Raum, über das gesamte Hörspektrum emittelt, gegen die Zeit;
    • 8 eine Impulsantwort vor der Nachbearbeitung in einer Wasserfall-Darstellung;
    • 9 eine Impulsantwort nach der Nachbearbeitung in einer Wasserfall-Darstellung;
    • 10 die Gruppenlaufzeit-Dispersion einer Impulsantwort vor der Nachbearbeitung;
    • 11 die Gruppenlaufzeit-Dispersion einer Impulsantwort nach der Nachbearbeitung.
  • BESCHREIBUNG VON AUSFÜHRUNGSFORMEN DER ERFINDUNG
  • 1 zeigt den Aufbau, mit dem das erfindungsgemäße Verfahren durchgeführt wird. Dabei sind zwei Lautsprecher 2 dargestellt, welche ein Eingangssignal Xl und Xr abspielen. Dieses wird als Ausgangssignal Yl und Yr von einem Kunstkopf 4 mit den Mikrofonen 8 aufgenommen. Die Mikrofone 8 sind im Inneren der Kunstkopf-Ohren 6 angeordnet. Die jeweiligen Übertragungsfunktionen H sind mit 9 bezeichnet.
  • 2 zeigt ein Beispiel einer Impulsantwort 10 als Pegelgebirge im Zeitbereich zwischen 300 und 1500ms und im Frequenzraum zwischen 20 Hz und 20 kHz. Wie man sieht, fällt die Impulsantwort über die Zeit ab, wobei an der Position 14 (39,6 Hz) ein Maximum der Signalhöhe 12 anzeigt, dass in diesen Frequenzbereich eine Raummode vorhanden ist, d.h. kommt es in dem Aufnahmeraum zu stehenden Wellen und damit einer Verstärkung der Schallwellen.
  • 3 zeigt beispielhafte Einstellungen für ein Filter zur Entzerrung eines Kunstkopf-Mikrofons. Dabei werden drei Bandfilter 22, 24, 26 verwendet, deren Verstärkungsprofil im Fenster 27 gezeigt ist. Man beachte insbesondere die Verstärkung 28 des Bandfilters 1, welcher eine Verstärkung von 8 dB bei einer Mittenfrequenz von 8 kHz beinhaltet. Dadurch wird der Frequenzeinbruch durch die destruktive Indifferenz der Concha-Höhlen-Reflektion auch „Pinna-Notch“ genannt, korrigiert.
  • Der Pinna-Notch ist auch in 4 zu sehen, welche eine Darstellung von Signalamplitude versus Frequenz bei einem Testsignal mit Pink Noise, aufgezeichnet mit einem Kunstkopf-Mikrofon Neumann KU100 zeigt. Bei 18 ist die Pinna-Notch als Pegeleinbruch im Frequenzbereich zwischen 7 und 8 kHz gut zu erkennen.
  • 5 zeigt wiederum eine Impulsantwort 10, hier jedoch nicht in einer perspektivischen Ansicht, sondern in einer Draufsicht, wobei der Signalpegel durch Höhenlinien (Isobarenlinien) wiedergegeben ist. 5 zeigt eine Impulsantwort 10 vor der erfindungsgemäßen Korrektur, aufgezeichnet mit einem Kunstkopfmikrofon. Das dargestellte Zeitfenster reicht von ca. 30ms bis 50ms nach Aufnahmebeginn. Im Bereich 32 ist der Direktschall noch nicht eingetroffen. Die Flanke 34 zeigt das Ansteigen des Signalpegels durch Eintreffen des Direktschallanteils an. Die Direktschallfront erreicht bei 36 ihren Höhepunkt und fällt dann wieder ab, bis bei 38 die frühen Reflektionen, z.B. Wandreflektionen, eintreffen. Danach fällt das Signal insgesamt langsam ab. In 5 ist bei 30 gut der Pinna-Notch zu erkennen, d.h. im Frequenzbereich zwischen 7,5 und 8 kHz ist, vor allem in Direktschallbereich ein starker Signaleinbruch zu sehen.
  • Eine ähnliche Darstellung zeigt auch die 6A, hier geht das Zeitfenster jedoch bis 125ms. Wenn man nun ein herkömmliches Filter- bzw. eine herkömmliche Equalisation der Impulsantwort 10 durchführt, muss man eine Signalanhebung im Bereich 7,5 bis 8 kHz im gesamten Zeitbereich durchführen, welche jedoch nach den frühen Reflektionen 38 gar nicht mehr notwendig ist und zu einer Klangverfärbung führt.
  • In 6 ist daher ein Beispiel einer erfindungsgemäßen Time-Windowed-Equalization gezeigt: Das Filter 40 mit einer Signalverstärkung von z.B. 8.0 dB wird lediglich im schraffierten Bereich angewendet, also im Zeitbereich zwischen 25 und 46ms nach Aufnahmebeginn und im Frequenzbereich zwischen 6,3 und 9,5 kHz. Bevorzugt wird hier eine Fensterfunktion mit abgerundeten Flanken verwendet, wie oben erwähnt. Dadurch lässt sich erreichen, dass die Pinna-Notch 30 im Direktschallanteil und in den frühen Reflektionen ausgeglichen wird, während die Diffusschallanteile unverändert bleiben. Somit wird dann eine erfindungsgemäß nachbearbeitete Impulsantwort 11 erreicht.
  • 7 zeigt zur Erläuterung nochmals eine gemessene Impulsantwort 10 (vor der Nachbearbeitung), in einer Wellenformdarstellung, also linear als Signalpegel (enthaltend alle Tonfrequenzen) gegen die Zeit. Nach etwa 35ms trifft der Direktschall 36 ein, einige Millisekunden später die frühen Reflektionen 38.
  • 8 zeigt nochmal eine Impulsantwort 10 (vor der Nachbearbeitung), in einer Wasserfalldarstellung, d.h. die hinterste Linie 42 zeigt den Signalverlauf 40ms nach Aufnahmebeginn, die weiteren Linien davor den Signalverlauf nach 60, 80, 100, 120, 140, 160 und 180ms. In der unbearbeiteten Impulsantwort 10 ist wiederum der Pinna-Notch bei 44 als Signaleinbruch zu erkennen, insbesondere im Direktschallanteil.
  • 9 zeigt die gleiche Darstellung wie 8, jedoch ist hier eine erfindungsgemäß verarbeitete Impulsantwort 11 zu sehen, bei welchem die Pinna-Notch sichtbar ausgeglichen ist - bei unverändertem Diffusschallbereich.
  • Die 10 und 11 demonstrieren einen unerwarteten Vorteil der erfindungsgemäßen zeitabhängigen Entzerrung: Und zwar ergibt sich durch die erfindungsgemäße Korrektur, insbesondere des Pinna-Notch zwischen 7 und 8 kHz, eine Verbesserung der Gruppenlaufzeit-Verzerrung. Dabei handelt es sich um das Phänomen, dass die Durchlaufzeit des Schalls für verschiedene Frequenzgruppen unterschiedlich sein kann, was aber für ein optimales Hörerlebnis nicht der Fall sein sollte. Bei Lautsprechern ergeben sich derartige Gruppenlaufzeit-Unterschiede typischerweise beim Übergang zwischen den verschiedenen Membranen, also z.B. beim Übergang vom Tieftöner zum Hochtöner.
  • 10 zeigt die Gruppenlaufzeiten 46 in Millisekunden über das Frequenzspektrum von 1 bis 20 kHz einer mit einem Kunstkopf gemessenen Impulsantwort eines Testlautsprechers vor der erfindungsgemäßen Nachbearbeitung. Wie man sieht, sind bis zu 3 kHz verschiedene lautsprecherbedingte Abweichungen vorhanden, die z.B. durch die Übergänge zwischen den verschiedenen Tönern hervorgerufen werden. Oberhalb von 3 kHz sollten aber keine derartigen Gruppenlaufzeit-Verzerrungen mehr vorhanden sein, denn in diesem Frequenzbereich arbeitet nur der Hochtöner. Zu sehen ist jedoch bei etwa 7,11 kHz - angezeigt durch den Strich 48 - eine starke Verzögerung 50. Es ist anzunehmen, dass diese durch kunstkopfbedingte Reflektionen und Interferenzen hervorgerufen wird.
  • Wird auf die Impulsantwort der 10 nun ein erfindungsgemäßes Filter angewendet, insbesondere eine Pegelanhebung in einem frühen Zeitfenster bis zu 50ms und in einem Frequenzbereich zwischen 6 und 9 kHz, ergibt sich die Gruppenlaufzeit-Verzerrung 52 der 11. Wie man sieht, ist die Gruppenlaufzeit-Differenz erheblich verringert worden, bei 54 ist nun nur noch eine vergleichsweise geringe „Verspätung“ von bis zu 7ms zu sehen.

Claims (21)

  1. Verfahren zur Auralisierung von Lautsprechern (2) oder anderen breitbandigen Schallquellen, mit folgenden Schritten: a. Aufstellen von zumindest einem Testlautsprecher (2) in einem Aufnahmeraum, sowie Aufstellen von zumindest einem Mikrophon (8) in dem Aufnahmeraum; b. Abspielen eines vorbestimmten Eingangssignals (Xl, Xr) durch den zumindest einen Testlautsprecher und gleichzeitiges Aufnehmen des dadurch erzeugten Klangereignisses (Yl, Yr) an dem zumindest einen Mikrophon (8) als Ausgangssignal; c. Berechnung einer Impulsantwort (10) des Testlautsprechers durch Entfaltung des Ausgangssignals mit dem Eingangssignal, oder durch Division des frequenztransformierten Ausgangssignals mit dem frequenztransformierten Eingangssignal und anschließender Transformation in den Zeitbereich; d. Nachbearbeitung der Impulsantwort (10), insbesondere durch eine Entzerrung, insbesondere durch ein oder mehrere Filter; e. Bereitstellen der nachbearbeiteten Impulsantwort (11) für den Testlautsprecher.
  2. Verfahren nach Anspruch 1, wobei die Impulsantwort (10, 11) mehrere Impulsantwortkanäle umfasst, welche jeweils das Impulsansprechverhalten eines Mikrophons auf einen Testlautsprecher darstellen.
  3. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Nachbearbeitung der berechneten Impulsantwort (10) eine zeitabhängige Entzerrung umfasst, wobei insbesondere zumindest ein Entzerrungs-Filter (26) nur in einem bestimmten Zeitfenster (40) angewendet wird.
  4. Verfahren nach einem der vorhergehenden Ansprüche, wobei der oder die Testlautsprecher (2) an verschiedenen Positionen aufgestellt werden, insbesondere an zwei für die Stereofonie geeignete Positionen, und wobei die Positionen und Aufstellwinkel des bzw. der Testlautsprecher und der Mikrophone (8) derart adjustiert werden, dass die mehreren Impulsantwortkanäle zumindest annähernd den gleichen zeitlichen Ursprung haben.
  5. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Impulsantwort (10) dadurch nachbearbeitet wird, dass eine oder mehrere raumabhängige Frequenzen (12, 14) nach einer Nachhallgrenze ausgeblendet werden.
  6. Verfahren nach einem der vorhergehenden Ansprüche, wobei der Aufnahmeraum Diffusoren und/oder schallabsorbierende Elemente enthält, insbesondere am Fußboden, an der Decke und/oder an zumindest einer Seitenwand.
  7. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Nachbearbeitung eine zeitlich begrenzte Dämpfung von Frühreflexionen (38) umfasst, insbesondere im Zeitbereich zwischen 0 und 15ms, vorzugsweise zwischen 2 und 10ms, besonders bevorzugt im Zeitbereich 2 bis 5ms nach Eintreffen des Direktschallanteils, insbesondere durch ein Filter.
  8. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Ausgangssignal an zwei Mikrophonen (8) im Rahmen einer binauralen Kunstkopf-Aufnahme aufgenommen wird.
  9. Verfahren nach Anspruch 8, wobei die Nachbearbeitung eine in den Kunstkopf (4) integrierte Diffusfeldentzerrung durch eine Freifeld-orientierte Entzerrung der Impulsantwort innerhalb eines frühen Zeitfensters ausgleicht, insbesondere innerhalb eines Zeitfensters (40) bis zu 30ms, bevorzugt bis zu 25ms, besonders bevorzugt bis zu 18ms nach Eintreffen des Direktschallanteils der Impulsantwort.
  10. Verfahren nach einem der vorhergehenden Ansprüche 8 oder 9, wobei die Impulsantwort (10) durch eine Pegelanhebung im Bereich des Pinna-Notch, insbesondere zwischen 6 und 9 kHz nachbearbeitet wird.
  11. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Nachbearbeitung ein Filter (24) zur Korrektur der Concha-Resonanz umfasst, insbesondere eine Pegelanhebung oder -senkung mit einer Mittenfrequenz zwischen 3 kHz und 5 kHz.
  12. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Nachbearbeitung ein Filter (22) zur Korrektur der Ohrkanal-Resonanz umfasst, insbesondere eine Pegelanhebung oder -senkung mit einer Mittenfrequenz zwischen 2 kHz und 3 kHz.
  13. Verfahren nach einem der vorhergehenden Ansprüche, wobei beim Abspielen des vorbestimmten Eingangssignals ein D/A Wandler mit IIR-basierten Digitalfiltern verwendet wird.
  14. Impulsantwort (11) eines Testlautsprechers, welche durch ein Verfahren gemäß einem der vorhergehenden Ansprüche erzeugt wurde.
  15. Übertragungsfunktion (9) eines Testlautsprechers, welche durch ein Verfahren gemäß einem der vorhergehenden Ansprüche 1-13 und/oder durch Fourier- oder Laplace-Transformation der Impulsantwort gemäß Anspruch 14 erzeugt wurde.
  16. Verfahren zum Nachbearbeiten einer Impulsantwort eines Lautsprechers oder einer anderen breitbandigen Schallquelle durch eine Entzerrung bzw. ein oder mehrere Filter, wobei insbesondere zumindest ein Entzerrungs-Filter nur in einem bestimmten Zeitfenster (49) angewendet wird.
  17. Verfahren zum Nachbearbeiten einer Impulsantwort gemäß Anspruch 14, wobei unterschiedliche Filter auf den einem Freifeld entsprechenden Zeitabschnitt der Impulsantwort und auf den einem Diffusfeld entsprechenden Zeitabschnitt der Impulsantwort angewendet werden.
  18. Verfahren zum Testen von Lautsprechern oder anderen breitbandigen Schallquellen, mit den folgenden Schritten: • Bereitstellen einer Impulsantwort (11) eines Testlautsprechers, insbesondere einer Impulsantwort gemäß Anspruch 14, • Bereitstellen eines Audiosignals; • Falten des Audiosignals mit der Impulsantwort des Testlautsprechers und • Ausgeben des gefalteten Audiosignals, insbesondere über einen Kopfhörer.
  19. Verfahren nach Anspruch 18, wobei mehrere Impulsantworten (11) verschiedener Testlautsprecher bereitgestellt werden, und wobei während der Ausgabe des gefalteten Audiosignals die zur Faltung verwendete Impulsantwort in Echtzeit auswechselbar oder bevorzugt umschaltbar ist.
  20. Audiofile, welches mit einer Impulsantwort gemäß Anspruch 14 eines Testlautsprechers gefaltet wurde.
  21. Computerprogramm welches Softwarecode-Abschnitte enthält, die einen Prozessor dazu veranlassen, ein Verfahren gemäß einem der Ansprüche 18 bis 19 durchzuführen, wenn die Softwarecode-Abschnitte auf dem Prozessor ausgeführt werden.
DE102018120229.6A 2018-08-20 2018-08-20 Verfahren zur Auralisierung von Lautsprechern und Impulsantwort Withdrawn DE102018120229A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102018120229.6A DE102018120229A1 (de) 2018-08-20 2018-08-20 Verfahren zur Auralisierung von Lautsprechern und Impulsantwort

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102018120229.6A DE102018120229A1 (de) 2018-08-20 2018-08-20 Verfahren zur Auralisierung von Lautsprechern und Impulsantwort

Publications (1)

Publication Number Publication Date
DE102018120229A1 true DE102018120229A1 (de) 2020-02-20

Family

ID=69320408

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102018120229.6A Withdrawn DE102018120229A1 (de) 2018-08-20 2018-08-20 Verfahren zur Auralisierung von Lautsprechern und Impulsantwort

Country Status (1)

Country Link
DE (1) DE102018120229A1 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002052895A1 (de) * 2000-12-22 2002-07-04 Harman Audio Electronic Systems Gmbh Anordnung zur auralisation eines lautsprechers in einem abhörraum bei beliebigen eingangssignalen

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002052895A1 (de) * 2000-12-22 2002-07-04 Harman Audio Electronic Systems Gmbh Anordnung zur auralisation eines lautsprechers in einem abhörraum bei beliebigen eingangssignalen

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BELLINI, Alberto et. al.: AQTtool an Automatic Tool for Design and Synthesis of Psychoacoustic Equalizers. In: Conference Paper 114th Audio Engineering Society Convention (AES), Amsterdam, Netherlands , 22.03.2003 - 25.03.2003, Convention Paper 5835 . S. 1 - 8. *
FARINA, Angelo et. al.: Software Implementation of an MLS Analyzer with Tools for Convolution, Auralization and Inverse Filtering. In: Conference Paper 103rd Audio Engineering Society Convention (AES), 26.09.1997 - 29.09.1997, Paper Number 4605 (O - 2). S. 1 - 24. *
FARINA, Angelo: Impulse Response Measurements by Exponential Sine Sweeps. In: Workshop Casa della Musica,Parma, 18. Oktober 2008, S. 1 - 85 *
HIEKKANEN, Timo ; MÄKIVIRTA, Aki ; KARJALAINEN, Matti: Virtualized listening tests for loudspeakers. In: Journal of the Audio Engineering Society, Bd. 57, 2009, H. 4, S. 237-251. - ISSN 0004-7554 (E); 1549-4950 (P). URL: http://www.aes.org/e-lib/inst/download.cfm/14816.pdf?ID=14816 [abgerufen am 2018-10-25]. *

Similar Documents

Publication Publication Date Title
Postma et al. Perceptive and objective evaluation of calibrated room acoustic simulation auralizations
Toole Listening tests-turning opinion into fact
US10104485B2 (en) Headphone response measurement and equalization
JP5464715B2 (ja) 音同調方法
Farina Advancements in impulse response measurements by sine sweeps
CN109565632A (zh) 有源监听耳机及其校准方法
CN109565633A (zh) 有源监听耳机及其双声道方法
Blau et al. Toward realistic binaural auralizations–perceptual comparison between measurement and simulation-based auralizations and the real room for a classroom scenario
Rasumow et al. Perceptual evaluation of individualized binaural reproduction using a virtual artificial head
DE19580412C1 (de) Verfahren und Vorrichtung zur Kompensation akustischer Verfälschungen infolge der Raumakustik bei der Tonwiedergabe durch elektro-akustische Wiedergabegeräte
DE102018120804B4 (de) Verfahren und Vorrichtung zur automatischen Konfiguration eines Audio-Ausgabesystems und nichtflüchtiges Speichermedium
EP0156334B1 (de) Simulationsverfahren und Vorrichtung (elektronischer Kunstkopf) zur Nachbildung der Übertragungseigenschaften des menschlichen Aussenohrs bei Freifeldbeschallung
DE102018120229A1 (de) Verfahren zur Auralisierung von Lautsprechern und Impulsantwort
US20210006919A1 (en) Audio signal processing apparatus, audio signal processing method, and non-transitory computer-readable recording medium
DE4125893A1 (de) Aufbereitung der wiedergabeakustik in kraftfahrzeuginnenraeumen
Lee et al. Development of a clarity parameter using a time-varying loudness model
Merchel et al. Influence of the frequency dependent directivity of a sound projector on the localization of projected sound
DE102023107308B3 (de) Psychoakustische Kalibrierung eines Audiowiedergabesystems
EP2503799B1 (de) Verfahren und System zur Berechnung synthetischer Außenohrübertragungsfunktionen durch virtuelle lokale Schallfeldsynthese
Berry Spatial reproduction of aircraft cabin noise in a full-scale mock-up
Ziemba Test signals for the objective and subjective evaluation of automotive audio systems
EP1900250B1 (de) Elektroakustisches verfahren
Leembruggen Précis of the TC-25CSS Theater Testing Report
Fürjes Methods to describe acoustic qualities of vehicles in stationary position
Karlberg Binaural sound reproduction in car compartments-A feasibility study using four channels

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R120 Application withdrawn or ip right abandoned