EP1410685A2 - Mehrkanaliges tonbearbeitungssystem - Google Patents

Mehrkanaliges tonbearbeitungssystem

Info

Publication number
EP1410685A2
EP1410685A2 EP00987030A EP00987030A EP1410685A2 EP 1410685 A2 EP1410685 A2 EP 1410685A2 EP 00987030 A EP00987030 A EP 00987030A EP 00987030 A EP00987030 A EP 00987030A EP 1410685 A2 EP1410685 A2 EP 1410685A2
Authority
EP
European Patent Office
Prior art keywords
sound
processing
processing system
binaural
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP00987030A
Other languages
English (en)
French (fr)
Inventor
Boris Weigend
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE19958105A external-priority patent/DE19958105A1/de
Application filed by Individual filed Critical Individual
Publication of EP1410685A2 publication Critical patent/EP1410685A2/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Definitions

  • 3-D audio technology can look back on a long history.
  • the aim of research and development in this area is to make the human ability of spatial hearing technically usable for various fields of application. Due to the ability of spatial, three-dimensional sound perception, humans are able to locate the position of any sound source with an accuracy of approx. 5 degrees.
  • the basis for spatial hearing is a complex coding system, which depending on its spatial position, the sound with an additional rattle provides information that can be specifically evaluated by human consciousness and provides the cognitive system with specific information about the exact position of the sound source.
  • PLATTE In 1975, PLATTE first provided the approach for error-free determination of the outer ear transfer function that flows into the head transfer function. (Arrangement for the exact reproduction of ear signals; progress in acoustics; Physik Verlag Weinheim pp. 361-363).
  • the missing acoustic context is restored by mixing the individual signals (instruments) together and the acoustic environment is created using artificially generated reverberation.
  • studio practice also deals with electrical or electronic instruments such as synthesizers, electric guitars, etc., in which electrical sound conversion by a microphone is not necessary, since such instruments already work electrically or electronically at the level of vibration generation.
  • the standard reproduction of properly prepared, spatial sound material is normally This is done using specially equalized, high-quality headphones to avoid multiplication effects of the head and outer ear transmission function when played through loudspeakers.
  • Another shortcoming of artificial head technology in the creation of sound recording signals is that an artificial head cannot be regarded as a replacement for a conventional microphone.
  • the sound engineer When recording a classic concert, the sound engineer sometimes uses several supporting microphones to emphasize the soloists in addition to the main microphones, which capture the orchestral sound as a whole.
  • the level of the individual microphone signals is regulated and mixed together in order to achieve the tonal result of the recording that is ultimately desired by the sound engineer.
  • artificial head signals cannot be mixed, as the listener would hear from different positions at the same time after mixing.
  • the generation of sound material that has been properly prepared electronically after the sound has been converted by the microphone is therefore a prerequisite for making the artificial head technology usable for use in multi-track recording technology (see GIERLICH, HW and GENUIT, K. "Structure and application of an electronic artificial head ", 13th Tonmeistertagung, Kunststoff 1984, report volume pp. 103-110).
  • Nonlinearities in the frequency and phase response of speakers have an extinction of spectral components This results in a reduction in the accuracy of location when localizing sound sources within the binaural sound material.
  • a sound signal almost never appears as a direct signal. Rather, a sound event consists of a mixture of direct sound and reflected sound in a specific ratio.
  • the broken and reflected sound strikes our hearing from different directions, whereby it is binaurally coded like direct sound.
  • Multi-speaker standards such as "Dolby Digital” have so far not been taken into account in the implementation of 3D audio processors. In the field of hi-fi and film dubbing, however, multi-speaker standards already play a major role. The combination of binaural and transaural signal processing within a multi-channel playback configuration such as "Dolby Digital" has not yet been realized.
  • multi-speaker standards offer decisive advantages over stereophony in terms of a more homogeneous sound field surrounding the listener.
  • Sound is reproduced e.g. with "Dolby-Digital" via a total of six loudspeakers, one of which is used exclusively for the reproduction of low-frequency signal components that cannot be located in their direction by the human ear.
  • sound sources analogous to the previous stereo reproduction, can be placed specifically within the loudspeaker level.
  • the arrangement of loudspeakers behind the listener enables sound sources to be placed in the rear position of the listener.
  • the aim of the invention is to create a process system for multi-track recording in recording studios, the sound result of which does not change after processing different from the everyday sound perception of humans within the natural environment.
  • the basis for the reproduction of the processed material is formed by multi-speaker standards such as "Dolby Digital” or other "Surround” standards.
  • the parameterization for transaural processing within the process system requires a listening position of the listener that is defined from the start, as well as an ideal placement of the loudspeakers.
  • the system to be patented couples a) binaural processing, b) transaural processing, and c) level adjustment within the playback channels.
  • the processing levels are dynamic Namely coupled and take place separately for each sound source to be processed (instrument, voice) in accordance with the requirements for use in multi-track recording technology.
  • a joystick which works in the three spatial levels, serves as the actuator; the spatial position of the actuator corresponds to the virtual spatial position of the respective sound source (instrument).
  • the transaural processing of sound sources of the system to be patented is only carried out if a representation of the respective instrument outside the frontal plane of the three front channels (left, center, right) is desired , e.g. the "Dolby Digital" standard already offers the possibility of a sufficiently precise placement of a sound source by means of level adjustment.
  • the strength of the transaural processing depends on the position of the actuator in relation to an image outside the front level.
  • the binaural and transaural processing takes place in accordance with the general requirements of the multi-speaker configuration of the respective multi-speaker standard depending on the position of the actuator.
  • the transaural processing takes place only if a representation of a sound outside the loudspeaker level of the respective arrangement is desired, ex- explicitly to allow top-down localization of a sound event that cannot be caused by changes in the sound level relationships within the five speakers.
  • a Doppler effect processing is provided to represent dynamic sound movement effects.
  • the effect processing enables the display of motion-related Doppler effects with a rapid dynamic positioning of a sound event in the sound mixing.
  • a sound source rapidly changing its position changes its pitch in relation to the position of the listener as it moves from point A to point B.
  • the interval of the pitch change depends on the speed of their movement. Together with the pitch, the spectral components and the volume change in relation to the relative position of the sound event to the listener.
  • the virtual position of a sound is changed by the actuation of the actuator.
  • the speed of movement of the actuator from point A to point B is decoded; the sound signal to be processed is accordingly subjected to a Doppler function in real time by the system.
  • the speed of the actuator movement determines the size of the interval A'-B ', as well as the type of spectral filtering and level control of the Doppler processing.
  • loudspeakers of different sizes are therefore linked to form a sound conversion system.
  • the electrical sound signal is divided into different frequency ranges by filtering and assigned to the different loudspeakers (multi-way principle).
  • the system to be patented includes a loudspeaker correction by a) correcting the individual frequency characteristics of the loudspeaker system and thus ensuring a linear transmission, and b) optimizing the phase behavior of the individual loudspeakers. This linearizes and thus optimizes the entire transmission path for the best possible reproduction and implementation of binaural and transaural processing.
  • a unit for generating three-dimensional Hall is also provided.
  • a sound event never occurs as isolated direct sound (free field).
  • a sound is always localized in relation to its spatial environment.
  • the reflection pattern of the sound based on refractions, diffractions and time delays due to physical obstacles plays an important role in the orientation and interpretation of a sound situation in relation to its surroundings.
  • a binaural and transaural transformation of the reflection components is therefore also required to represent natural listening environments in the context of a complete 3-D audio process system.
  • the holophonic Hall processor effects a] the generation of a virtual three-dimensional listening environment and b] the individual placement of different signal sources within this virtual space.
  • the room simulation is generated on a multi-channel basis.
  • the early reflections of a sound event within the processing are provided with different directional coefficients with regard to the reflection behavior of the virtual space and processed separately.
  • the product of reverberation processing of the individual reflection is processed using the binaural outer ear transmission function for the respective virtual sound direction.
  • the generation of the respective multichannel signal is carried out by virtual loudspeakers and microphones, the loudspeakers representing the inputs and the microphones representing the outputs of the sound within the virtual space.
  • the respective output of the virtual microphone can be assigned in the output level (matrixing) to a physical electrical output channel, which enables adaptation to different loudspeaker configurations or standards, such as "Dolby Digital".
  • a second, parallel signal processing level is used to generate an artificial diffuse sound field, which is generated by the repeated refraction and reflection of sound within a room.
  • the individual diffuse components can no longer be located by the human ear, but rather appear as a homogeneous mixture of tones (reverb tail).
  • Fig.l is a block diagram of the signal processing of a 3-D audio processor according to the prior art
  • the signal is first processed in an input stage 11.
  • the signal is subjected to a binaural processing 13 at the digital level, the monophonic signal being converted into two aurally processed signals.
  • the signal is provided with the head transmission functions (HRTF's), the type of function being preselected using a control unit.
  • HRTF's head transmission functions
  • a transaural processing 14 uses crosstalk compensation to dampen the signal components that fall from the right speaker to the left ear and from the left speaker to the right ear during stereo playback. This results in a head-related decoupling of the two channels with respect to their signal sources (loudspeakers) and their arrangement, in order to enable the binaural sound material to be reproduced via stereo loudspeakers.
  • a D / A conversion is carried out in signal output 15 in order to pass on the two transformed signals as an analog signal to a mixer or to a sound storage device.
  • a multi-channel sound processing system shown in FIG. 2, comprises two signal processing levels, a direct signal processing level 2 and a room simulation level 3, which are responsible for the sound result, as well as a special, multi-channel correction unit for loudspeakers 4.
  • An actuator 1 is provided for manually influencing the processing of the system, which works in the three spatial levels.
  • the sound material to be processed is fed to the input stages 18 and 20 of the two processing levels 2 and 3 via the play paths of a mixer.
  • a mixer stage 19 enables the input signals of the direct processing to be passed on to the room simulation level.
  • the input stages 18, 20 are multi-channel in order to enable a] independent processing in processing level 2 and thus a variable position of the individual sound signals, b] independent processing and thus a variable position of the individual sound signal at level 3 in room simulation to ensure within a virtual room, and c] a generation of different virtual rooms and room combinations, for example To allow space in space for a particular signal.
  • the system is controlled manually by a special actuating mechanism that works in three dimensions.
  • the actuating mechanism 16 When the actuating mechanism 16 is actuated, the position and the speed of the change in position are converted into control commands by a recognition unit 17.
  • the vertical arrows show the influence of the control commands on the respective signal processing groups 21, 22, 23, 24 and 32, 33, 34 and 35.
  • the Doppler processing 21 following the direct signal processing level 2 is used to represent acoustic movement effects such as find use in film sound design.
  • the Doppler processing also takes place as a function of the actuator 1, with the recognition unit 17 evaluating the speed at which the actuating mechanism is actuated when a sound signal changes position.
  • the Doppler processing 21 comprises the functions of sound diffraction and the filtering of the sound signal, the strength of the sound diffraction and the type of filter function being predetermined by the starting and end positions and the speed of the change in position of the actuating mechanism 16 of the actuator 1.
  • the direct signal processing level 2 is subjected to a binaural transformation 22 after the Doppler processing, the monophonic signal being converted into a two-channel, binaural signal according to the head transmission functions, separately for each channel.
  • the binaural processing of the signal is carried out in accordance with the specification of the actuator 1, which determines the parameters of the binaural processing by its position, in order to enable the virtual placement of a sound signal in relation to the spatial position of the adjusting mechanism 16.
  • the subsequent transaural processing 23 in contrast to the transaural processing according to the prior art, also takes place as a function of the position specification of the actuator. The position determines the degree of transaural processing.
  • the transaural processing is carried out to support the level control level 24, through which sound sources are placed within the multi-speaker level (surround level). It is activated when sound events outside this level are to be displayed, but also to decouple the binaurally transformed sound signal from the loudspeakers as a localizable sound source.
  • Room simulation level 3 is used for the virtual design of sound spaces in which the individual sound signals, which are fed to the processing through the multi-channel input stage 20 or the mixing stage 19, can each be positioned independently of one another. The signals are subjected to two different processes.
  • a processing 31 is used to electronically generate a diffuse sound field that arises from multiple refraction and reflection within a natural space (reverb tail).
  • Processing 32,33,34,35 serve to spatialize and independently select the directions of incidence of the early reflections, which depend on the position of the Mechanism 16 of the actuator 1 happens, as well as the independent positioning of the individual sound sources within the virtual space.
  • the form of processing is carried out according to the same pattern as that within the direct signal processing level 2.
  • a multi-channel speaker correction 4, 40 which is specially adapted to the processing processes of the system, is used to eliminate interference variables.
  • the speakers used for reproduction are subjected to a phase and frequency response correction to enable the best possible linear reproduction of the transformed sound material.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Ein mehrkanaliges Tonbearbeitungssystem für die Tonstudio- und elektroakustische Übertragungstechnik zur Gestaltung von virtuell-realen Hörumgebungen auf Basis von Mehrlautsprecherstandards ist dadurch gekennzeichnet, dass die dimensionsgerechte Darstellung von Schallereignissen neben der binauralen und transauralen Bearbeitung durch eine den gewünschten Schallpositionen gemässen Regulierung des Signalpegels innerhalb einer mehrkanaligen Lautsprecherumbegung erfolgt.

Description

Mehr analiges Tonbearbeitungssystem
Stand der Technik
Die 3-D Audiotechnik kann bereits auf eine lange Geschichte zurückblicken.
Ziel der Forschung und Entwicklung in diesem Bereich ist es, die menschliche Fähigkeit des räumlichen Hörens für verschiedene Anwendungsfelder technisch nutzbar zu machen. Durch die Fähigkeit der räumlichen, dreidimensionalen Schallwahrnehmung ist der Mensch in der Lage die Position einer beliebigen Schallquelle auf ca. 5 Grad genau zu orten.
Die Grundlage für das räumliche Hören ist ein komplexes Kodiersystem, welches dem Schall in Abhängigkeit von seiner räumlichen Position mit einer zusätzlichen Rieh- tungsinformation versieht, die vom menschlichen Bewußtsein gezielt ausgewertet werden kann und dem kognitiven System konkrete Informationen über die exakte Position der Schallquelle liefert.
Ergebnisse der Kognitivforschung in bezug auf das menschliche Hören, speziell der räumlichen Schallwahrnehmung, wurden bereits in einer Reihe von Verfahren für die gehörrichtige Aufnahme und Wiedergabe von Schall, wie z.B. in der Kunstkopfaufnahmetechnik, gezielt technisch anwendbar gemacht.
Hierzu wurden bereits 1886 in den "Bell-Laboratories" Versuche zur Optimierung der Telephonübertragung mittels zweier Kohlekörnermikrophone, die in einen Puppentorso eingebaut wurden, unternommen, um so auf diese Weise die menschliche Hörwahrnehmung nachzubilden.
Diese ersten Versuche zur Nutzbarmachung der menschlichen Hörwahrnehmung waren ebenso wenig erfolgreich, wie spätere Versuche in den Philips-Laboratorien von 1939, bei denen wiederum ein Puppentorso diesmal mit Kondensatormikrophonen bestückt wurde (vgl. DE BOER, K. und VERMEULEN, R. : Eine Anlage für einen Schwerhörigen. Philips Technische Rundschau Nr. 4, 1939, S. 329-332).
Selbst ein nach Vorgaben von Plenge, Kürer und Wilkens in den siebziger Jahren von der Firma Neumann in Serie gefertigter und aus der DE 19 27 401 hervorgehen- der Kunstkopf konnte ebenfalls, trotz vergleichbar hochwertiger Komponenten, die bei der Realisation verwendet wurden, nicht überzeugen.
Der Grund für die mitunter mangelhafte Arbeitsweise von KunstkopfSystemen bis Anfang der achtziger Jahre war einerseits die unzureichende technische Qualität der Komponenten innerhalb der Übertragungsstrecke des akustischen Signals, bishin zur Wiedergabe, anderseits die Nichtberücksichtigung diverser Parameter, die sich innerhalb des menschlichen Hörapparates für die gehörrichtige Kodierung eines Schalls verantwortlich zeichnen.
Die Wirkungsweise eines 3-D-Audioprozessors basiert zum Teil auf den physikalischen Grundlagen der Kunstkopftechnik. Die Güte und somit die Qualität der dreidimensionalen Reproduktion des Klanggeschehens, welches mit Hilfe eines 3-D-Prozessors erstellt wird, ist deshalb auch in nicht unbedeutendem Maße abhängig von der sorgfältigen Ermittlung und Implementation der Transformationsprozesse, denen ein Schall durch den menschlichen Hörapparat unterzogen wird, der sog. binauralen Funktionen, die durch gehörrichtige Meßverfahren erfaßt werden.
Wie wichtig die genaue Ermittelung der HRTF' s (Kopfübertragungsfunktionen) für die generelle Funktion von 3-D-Audio ist, zeigt die Geschichte der Kunstkopftechnologie, die erstmalig Anfang der achtziger Jahre durch die Entwicklung des "Aachener Kopfes" einen signifikan- ten Qualitätssprung vollzog und somit die Anwendung der Kunstkopfaufnähme als objektives Meßverfahren in der gehörrichtigen Diagnose von Schall ermöglichte.
Den Ansatz zur fehlerfreien Ermittlung der in die Kopfübertragungsfunktion einfließende Außenohrübertragungs- funktion lieferte erstmalig 1975 PLATTE. (Anordnung zur genauen Reproduktion von Ohrsignalen; Fortschritte der Akustik; Physik Verlag Weinheim S. 361-363).
Durch die verbesserte Ermittlung der Außenohrübertra- gungsfunktion konnte die Vorne-Hinten Unterscheidung, als kritischer Parameter innerhalb der künstlich substituierten räumlichen Hörwahrnehmung, entscheidend verbessert werden.
Die objektive Ermittlung der KopfÜbertragungsfunktion mittles eines Kunstkopfes konnte erstmalig durch den Gebrauch des übertragungsoptimierten, rauscharmen "Aachener"-Kunstkopfes HMS 1 erfolgen. (Vgl. K. Genuit : Optimierung eines Kunstköpfaufnahmesystems, "Studio" Nr. 46, 1981, S.10-18) .
Bei der Aufnahme und Bearbeitung von Schall im modernen Tonstudio werden, im Gegensatz zur Kunstköpfaufnähme, bei der ein Schallfeld in seiner Gesamtheit mittels eines Kunstkopfes direkt zweikanalig (stereophon) aufgenommen wird, jedoch meist Schallsignale (Instrumente) abstrahiert, d.h. aus ihrer natürlichen akustischen Umgebung und von anderen Schallquellen isoliert, getrennt aufgenommen, um dann jeweils separat nachträglich in ihrer Dynamik und Klangfarbe bearbeitet werden zu können. (Mehrspuraufnahmeverfahren)
Hierbei wird der fehlende akustische Kontext durch zusammenmischen der einzelnen Signale (Instrumente) wiederhergestellt und die akustische Umgebung mittels künstlich generiertem Nachhall geschaffen.
Des weiteren hat man in der Studiopraxis auch mit elektrischen bzw. elektronischen Instrumenten wie Synthesizern, Elektrogitarren usw. zu tun, bei denen eine elektrische Schallwandlung durch ein Mikrophon nicht nötig ist, da solche Instrument bereits auf Ebene der Schwingungserzeugung elektrisch, bzw. elektronisch arbeiten.
Da der Hauptteil der gegenwärtigen Musikproduktion quasi abstrakt im Tonstudio unter nicht unbedeutendem Einsatz der genannten elektronischen Instrumente geschieht, sind in der Vergangenheit bereits Versuche unternommen worden, um die Prinzipien der Kunstkopftech- nologie auch für die Aufnahmeverfahren im modernen Tonstudio zu adaptieren mit dem Ziel, eine binaurale Nachbearbeitung von elektroakustischen Signalen für den Einsatz im Mehrspur-Aufnahmeverfahren zu ermöglichen. (Vgl.: WEIGEND, B. "Vom Hören zur Technik", Anwendung von binauraler Signalbearbeitung und Psychoakustikpro- zessoren im Studioalltag, Teil 3, STUDIO-Magazin, Nr. 3, '93, S.30-38) .
Die standardmäßige Wiedergabe von gehörrichtig aufbereitetem, räumlichem Klangmaterial erfolgt normalerwei- se über eigens entzerrte, hochwertige Kopfhörer, um Multiplikationseffekte der Kopf- und Außenohrübertra- gungsfunktion bei Wiedergabe über Lautsprecher zu vermeiden.
Diese Effekte treten bei der Lautsprecherwiedergabe von binauralem Tonmaterial in sofern auf, als daß diese beim Hören als Schallquelle von vorne geortet werden und das Tonmaterial somit erneut einer binauralen Kodierung durch das Ohr des Zuhörers unterliegt, was eine Verzerrung der räumlichen Information und eine Verminderung speziell der hoch- und tieffrequenten Signalanteile zur Folge hat.
Ein weiteres Manko der Kunstkopftechnologie bei der Erstellung von Tonaufnahmensignalen ist, daß ein Kunstkopf nicht als Ersatz für ein herkömmliches Mikrophon angesehen werden kann.
Bei einer Aufnahme eines klassischen Konzertes werden vom Tonmeister neben den Hauptmikrophonen, die den Orchesterklang in seiner Gesamtheit erfassen, mitunter mehrere Stützmikrophone zur Hervorhebung der Solisten verwendet. Die einzelnen Mikrophonsignale werden in ihrem Pegel reguliert und zusammengemischt, um so das letztlich vom Tonmeister gewünschte klangliche Resultat der Aufnahme zu erzielen. Im Gegensatz zu herkömmlichen Tonsignalen können KunstkopfSignale jedoch nicht gemischt werden, da der Zuhörer nach der Mischung quasi aus verschiedenen Positionen zugleich hören würde. Die Erzeugung von gehörrichtig aufbereitetem Tonmaterial auf elektronischem Wege nach der Schallwandlung durch das Mikrofon ist somit die Voraussetzung, um die Kunstkopftechnologie für die Anwendung in der Mehrspuraufnahmetechnik nutzbar zu machen (vgl. GIERLICH, H.W. und GENUIT, K. "Aufbau und Anwendung eines elektronischen Kunstkopfes", 13. Tonmeistertagung, München 1984, Berichtsband S. 103-110).
Die Vorgehensweisen bei der Realisation von 3-D- Audioprozessoren sind mitunter stark verschieden, da diese für verschiedene Anwendungszwecke konzipiert werden. Es handelt sich einerseits um sogenannte "Stereobasisverbreiterer" ("Q-Sound®") , die eine räumliche Abbildung von Ton außerhalb der Stereoebene ermöglichen sollen, wobei hier der Ansatz zur Realisation solcher Systeme eher empirisch erfolgt, als auf Basis von streng wissenschaftlicher Forschung.
Anderseits erfolgt bei fundamentaleren Lösungsansätzen, die eine tatsächliche virtuell drei-dimensionale Plazierung von Schall zum Ziel haben, z.B. der des "elektronischen Kunstkopfes" bislang die Lösungsansätze nicht eloquent genug, um zu einem wirklich zufriedenstellenden Resultat zu kommen. Ferner haben derartige Systeme ebenfalls die Aufgabe eine Wiedergabe von binaural transformierten Audiosignalen auf Lautsprechern zu ermöglichen. 1.2 Probleme der Wiedergabe von binaural transformierten Signalen über Lautsprecher nach den Stand der Technik
Die bislang mitunter unbefriedigenden klanglichen Resultate der verfügbaren 3-D-Audioprozessoren für Lautsprecherwiedergabe nach dem in Fig. 1 dargestellten Stand der Technik und die eingeschränkte Verwendbarkeit im Rahmen der Mehrspuraufnahmetechnik in Tonstudios sind auf folgende Ursachen zurückzuführen:
1. Ein Hauptgrund bislang ist u.a. die unzureichende Eliminierung von Störgrößen, die bei Lautsprecherwiedergabe entstehen.
Aufgrund der Anfälligkeit von binaural aufbereitetem Tonmaterial in bezug auf Nichtlinearitäten innerhalb der Übertragungskette ist eine Eliminierung von Störgrößen, die durch die Übertragungseigenschaften der einzelnen Komponenten innerhalb des Bearbeitungs- und Übertagungssystems auftreten unverzichtbar, um ein bestmögliches und funktionelles klangliches Resultat zu erhalten.
Neben der präzisen Messung, Mittelung und Implementation der Kopfübertragungsfunktionen gilt dies speziell für die Ausschaltung von Störgrößen, die bei der Lautsprecherwiedergabe entstehen.
Nichtlinearitäten im Frequenz- und Phasengang von Lautsprechern haben eine Auslöschung von Spektralkomponen- ten zur Folge, die die Ortungsschärfe bei der Lokalisation von Schallquellen innerhalb des binaural aufbereiteten Tonmaterials herabsetzen.
Somit ist eine Korrektur dieser naturgegebenen Störgrößen, die bei der Aufteilung von Frequenzgebieten durch Filterung bei Mehrwegelautspechern entstehen und bei der elektromechanischen Schallwandlung, unabdingbar, da eine hinreichende Konvergenz der einzelnen Spektralkomponenten hier nicht gewährleistet ist.
2. Aufgrund der diffizilen Bearbeitung eines Schalls, die, bedingt durch die anatomische Gestalt des menschlichen Hörapparates, vor der Wandlung in mechanische Schwingungen des Trommelfells ausgeführt wird, ist eine überaus störungsfreie und objektive Messung binauraler Parameter, wie der Kopf- und Außenohrübertragungsfunk- tion und deren sorgfältige Implementation auf ein rechnergestütztes Prozeßsystem notwendig.
Hierbei hat jegliche Abweichung von den naturgegebenen Übertragungsfunktionen bzw. die Nichtberücksichtigung von kritischen Parametern eine Verminderung der Ortungsschärfe zur Folge.
Dies gilt speziell für die Vorne-Hinten-Unterscheidung bei der Lokalisation eines binaural bearbeiteten Schallereignisses. Die Implementation von köpfbezogenen Übertragungsfunktionen mittels Kunstkopf-Meßverfahren, bei denen Kunstköpfe minderwertiger Qualität benutzt werden, haben zur Folge, daß die Lokalisationsschärfe des transformierten Klangmaterials bei abnehmender Dichte des Spektrums, speziell im Bereich oberhalb von 4 kHz nicht hinreichend ausgeprägt ist und demnach für die Applikation in Prozessoren für die professionelle Tonstudiotechnik ungeeignet sind. (Vgl.: MAJIMA, Y., IMAI, T. und KIKUMOTO, T.: "The RSS processor; Tree di- mensional sound generation from conventionally recorded two Channel sources", Roland Co., Japan, 1991, S.4).
3. Innerhalb der natürlichen Hörumgebung tritt ein Schallsignal fast niemals als reines Direktsignal auf. Ein Schallereignis setzt sich vielmehr aus einem Gemisch von Direktschall und reflektiertem Schall in einem besimmten Verhältnis zusammen.
Anhand des Reflektionsmusters des Hallanteils werden dem Ohr zusätzliche Informationen in bezug auf Umgebung, Raumgröße, Beschaffenheit des Raumes und der relativen Entfernung der akustischen Hindernisse geliefert.
Der gebrochene und reflektierte Schall trifft hierbei aus unterschiedlichen Richtungen auf unser Gehör, wobei er wie der Direktschall binaural kodiert wird.
Bei der künstlichen Erzeugung von 3-D-Schallereignissen ist deswegen die Generierung von binauralem Nachhall erforderlich, um dem Ohr des Hörers zusätzliche Information für die Lokalisation und Definition des Schallereignisses zur Verfügung zu stellen. Grundsätzlich sind Signale nach der binauralen Transformation nicht mehr kompatibel zu herkömmlichen Mono- oder Stereosignalen.
Signale dieser drei Kategorien können deswegen nicht ohne weiteres miteinander gemischt werden.
Es ist deshalb erforderlich, daß alle Komponenten, die bei der Tonmischung binaural gewandelten Signalen zusätzliche Signalanteile zufügen, wie z.B. künstlicher Nachhall, ebenfalls auf binauraler Ebene arbeiten.
Es ist wenig sinnvoll, binaurales Tonmaterial mit herkömmlichen, auf Stereobasis arbeitenden Signalprozessoren nachzubearbeiten, bzw. Signale zu erzeugen, die dann in der Tonmischung dem binauralen Material zugemischt werden, da diese nicht einer binauralen Kodierung obliegen und somit den gewünschten räumlichen Effekt verwässern.
Es ist deswegen zwingend das innerhalb eines kompletten 3-D-Audioprozeßsystems alle Nachbearbeitungseffekte, die im Tonstudio verwendet ebenfalls auf binauraler Ebene arbeiten. Dies gilt insbesondere für künstlichen Nachhall.
4. Durch die transaurale Bearbeitung bei 3-D- Audioprozessoren, die zur Wiedergabe von binaural transformiertem Tonmaterial über Stereolautsprecher notwendig ist, wird die Beliebigkeit der Position des Zuhörers in bezug auf die Position zu den Lautsprechern eingeschränkt.
Das Maß der Ortbarkeit einer virtuellen Schallquelle hängt bei der stereophonen Wiedergabe von binauralem Tonmaterial auch letztlich von der idealen Position des Hörers zu den Lautsprechern ab.
Schon eine geringfügige Veränderung der Position des Hörers aus dem Bereich der Idealanordnung Lautsprecher - Hörer hat Verluste bei der genauen Ortsbestimmung einer virtuellen Schallquelle zur Folge.
2. Darstellung der Erfindung:
In dem mehrkanaligen Tonbearbeitungssystem gemäß der Erfindung werden Verluste der Ortbarkeit bei der nicht idealen Position eines Hörers durch die Verknüpfung der verschiedenartigen Möglichkeiten der Schallokalisati- onssteuerung bei Mehrlautsprecherkonfigurationen (Surround) kompensiert.
"System zur Erzeugung von virtuellen dreidimensionalen Schallsituationenen auf Basis von Mehrlautsprecher- Systemen"
Mehrlautsprecher-Standards, wie z.B. "Dolby-Digital" werden bislang bei der Realisation von 3-D-Audio- Prozessoren nicht berücksichtigt. Im Bereich Hi-Fi und bei der Filmvertonung spielen Mehrlautsprecherstandards jedoch bereits eine tragende Rolle. Die Verbindung von binauraler und transauraler Signalbearbeitung innerhalb einer Mehrkanalwiedergabekonfiguration wie "Dolby-Digital" wurde bislang nicht verwirklicht.
Mehrlautsprecher-Standards bieten jedoch gegenüber der Stereophonie entscheidende Vorteile hinsichtlich eines homogeneren, den Hörer umgebenden Schallfeldes.
Die Wiedergabe von Ton erfolgt z.B. bei "Dolby-Digital" über insgesamt sechs Lautsprecher, wobei einer ausschließlich zur Wiedergabe tieffrequenter Signalanteile dient, die vom menschlichen Gehör nicht in ihrer Richtung geortet werden können.
Von den fünf Hauptlautsprechern befinden sich in Front des Hörers drei Lautsprecher (linker Kanal, Center- Kanal, rechter Kanal) und zwei in rückwärtiger Position (hinten-links-Kanal, hinten-rechts-Kanal) .
Mithilfe von Produktionsapparaturen, die auf diesen Standard ausgelegt sind, können Schallquellen, analog zur bisherigen Stereowiedergabe, innerhalb der Lautsprecherebene gezielt plaziert werden.
Wie bei der herkömmlichen Stereotonmischung geschieht dies durch Abstimmung der jeweiligen Pegelverhältnisse zwischen den einzelnen Wiedergabekanälen, wobei Schal- lereignisse zwischen den Lautsprechern als sog. Phantomschallquellen dargestellt werden.
Im Gegensatz zur Stereo-Tonmischung ist hierbei durch die Anordnung von Lautsprechern hinter dem Hörer eine Plazierung von Klangquellen in der rückwärtigen Position des Zuhörers möglich.
Obwohl so eine erweiterte räumliche Darstellung im Vergleich zur Stereophonie möglich wird, werden bei herkömmlichen Mehrlautsprecher-Aufnahmen jedoch die Lautsprecher stets noch als Schallquelle geortet.
Die Richtungsmanipulation des Toningenieurs bei der Erstellung einer Aufnahme ist bislang immer mit der Veränderung der Pegelverhältnisse innerhalb der Lautsprecherebene verbunden und somit mit der Gestaltung von Phantomschallquellen, die innerhalb dieser Ebene dadurch auftreten.
Eine generelle Entkopplung des Schallereignisses von den physischen Übertragern (Lautsprechern) erfolgte bislang nicht. Ebenso ist eine Plazierung von Schallquellen außerhalb der Lautsprecherebene im Rahmen einer Mehrlautsprecheranwendung (speziell Darstellungen von oben und unten) bei der standardmäßigen Tonmischung nicht möglich.
Ziel der Erfindung ist es, ein Prozeßsystem für die Mehrspuraufnahme in Tonstudios zu schaffen, dessen klangliches Resultat nach der Bearbeitung sich nicht von der alltäglichen Schallwahrnehmung des Menschen innerhalb der natürlichen Umgebung unterscheidet.
Die Basis für die Wiedergabe des bearbeiteten Materials formen hierbei Mehrlautsprecherstandards wie z.B. "Dolby-Digital" oder andere "Surround"- Standards.
Das zu patentierende System unterscheidet sich von bislang bekannten 3-D-Audioprozessoren in den folgenden Punkten:
Die Parametrisierung bei der transauralen Bearbeitung innerhalb des Prozeßsystems setzt eine von vornherein festgelegte Abhörposition des Hörers voraus, sowie eine ideale Aufstellung der Lautsprecher.
Abweichungen von der Idealposition Hörer - Lautsprecher, sowie ungünstige Plazierung der Lautsprecher, bei der in der Relation: rechter Lautsprecher - rechtes Ohr; linker Lautsprecher - linkes Ohr Laufzeitdifferen- zen zwischen dem rechten und linken Kanal auftreten, haben eine mitunter gravierende Verschlechterung der Ortbarkeit der Schallquellen innerhalb des binauralen Tonmaterials zur Folge.
Um dieses Manko zu beheben, verkoppelt das zu patentie¬ rende System a) binaurale Bearbeitung, b) transaurale Bearbeitung, sowie c) Pegelstellung innerhalb der Wiedergabekanäle. Die Bearbeitungsebenen sind hierbei dy- namisch verkoppelt und erfolgen, gemäß den Erfordernissen für die Anwendung in der Mehspuraufnahmetechnik, für jede zu bearbeitende Schallquelle (Instrument, Stimme) getrennt.
Als Stellglied dient ein Joystick, der in den drei räumlichen Ebenen arbeitet; die räumliche Position des Stellglieds entspricht hierbei der virtuellen räumlichen Position der jeweiligen Schallquelle (Instrument).
Im Gegensatz zu 3-D-Audioprozessoren, die auf Stereo- Basis arbeiten, erfolgt die transaurale Bearbeitung von Schallquellen des zu patentierenden Systems nur dann, wenn eine Darstellung des jeweiligen Instrumentes außerhalb der Frontalebene der drei Frontkanäle (links, center, rechts) gewünscht ist, da z.B. der "Dolby- Digital"- Standard bereits die Möglichkeit einer hinreichend genauen Plazierung einer Schallquelle mittels Pegelstellung bietet.
Die Stärke der transauralen Bearbeitung ist hierbei von der Stellung des Stellgliedes in bezug auf eine Abbildung außerhalb der Frontebene abhängig.
Die binaurale und transaurale Bearbeitung erfolgt hierbei gemäß den generellen Erfordernissen der Mehrlautsprecherkonfiguration des jeweiligen Mehrlautsprecher- Standards in Abhängigkeit der Position des Stellgliedes. Die transaurale Bearbeitung erfolgt nur dann, wenn eine Darstellung eines Schalls außerhalb der Lautsprecherebene der jeweiligen Anordnung gewünscht ist, ex- plizit zur Ermoglichung einer Oben-Unten-Lokalisation eines Schallereignisses, das nicht durch Veränderungen der Schallpegelverhaltnisse innerhalb der fünf Lautsprecher hervorgerufen werden kann.
2.
Zur Darstellung von dynamischen Schallbewegungseffekten ist eine Doppler-Effekt-Bearbeitung vorgesehen.
Die Effektbearbeitung ermöglicht die Darstellung von bewegungsbezogenen Dopplereffekten bei einer raschen dynamischen Positionierung eines Schallereignisses bei der Tonmischung.
Eine rasch seine Position verändernde Schallquelle ändert bei ihrer Bewegung von Punkt A nach Punkt B ihre Tonhohe in Relation zu der Position des Hörers. Das Intervall der Tonhohenanderung ist hierbei abhangig von der Geschwindigkeit ihrer Bewegung. Zusammen mir der Tonhohe verandern sich die Spektralanteile und die Lautstarke in bezug auf die relative Position des Schallereignisses zum Hörer.
In dem vorliegenden Tonbearbeitungssystem wird die virtuelle Position eines Schalles durch die Betätigung des Stellgliedes verändert. Die Bewegungsgeschwindigkeit des Stellgliedes von Punkt A nach Punkt B wird hierbei dekodiert; das zu bearbeitende Schallsignal wird von System dementsprechend m Echtzeit einer Doppler- Funktion unterworfen. Die Geschwindigkeit der Bewegung des Stellgliedes bestimmt hierbei die Größe des Intervalls A'-B', sowie die Art der spektralen Filterung und Pegelregulierung der Doppler-Bearbeitung.
3.
Bisherige 3-D-Audioprozessoren, die für Lautsprecherwiedergabe ausgelegt sind, berücksichtigen in ihrer Arbeitsweise nicht die spezifischen Übertragungseigenschaften von Lautsprechern. Aufgrund der mechanischen und elektromagnetischen Eigenschaften des Schallwandlungsapparates (Auslenkungssystem, Membran, Aufhängung) sind einzelne Lautsprecher einer gewissen Größenordnung nur in der Lage ein gewisses Frequenzband linear zu reproduzieren.
In der Praxis werden deswegen Lautsprecher unterschiedlicher Größe zu einem Schallwandlungssystem verknüpft Das elektrische Schallsignal wird hierbei mittels Filterung in verschiedene Frequenzgebiete unterteilt und den verschiedenen Lautsprechern zugeordnet (Mehrwegeprinzip) .
Bei der Filterung und Wiedergabe der Teilspektren entstehen systembedingte Phasendrehungs- und Übersprech- Effekte zwischen den einzelnen Wegen, die aus dem Prinzip der Filterung und den Schwingungseigenschaften der einzelnen Lautsprecher resultieren. Derartige negative Nebeneffekte resultieren in dynamisch auftretenden Frequenzauslöschungen und beeinflussen die Wiedergabequalität des Lautsprechersystems.
Bei der Applikation von binauraler Signalbearbeitung erweisen Frequenzauslöschungen sich als fundamentale Störgrößen, die eine deutliche Abschwächung der Ortungsschärfe eines binaural bearbeiteten Schalls zur Folge haben. Zur Eliminierung dieser Störgrößen beinhaltet das zu patentierende System eine Lautsprecherkorrektur, indem a) die individuelle Frequenzcharakteristik des Lautsprechersystems korrigiert und somit eine lineare Übertragung sichergestellt wird, und b) die einzelnen Lautsprecher untereinander in ihrem Phasenverhalten optimiert werden. Hierdurch wird die gesamte Übertragungsstrecke zur bestmöglichen Wiedergabe und Umsetzung der binauralen und transauralen Bearbeitung linearisiert und somit optimiert.
Es ist ferner neben dem eigentlichen 3-D-Transformation der einzelnen elektrischen Signalquellen eine Einheit zur Erzeugung von dreidimensionalem Hall vorgesehen. In der natürlichen Hörumgebung des Menschen tritt ein Schallereignis nie als isolierter Direktschall (Freifeld) auf. Die Lokalisation eines Schalls erfolgt immer in bezug auf seine räumliche Umgebung. Das Reflektionsmuster des Schalls anhand von Brechungen, Beugungen und Zeitverzögerungen durch physikalische Hindernisse spielt bei der Orientierung und Interpretation einer Schallsituation auf ihre Umgebung eine wesentliche Rolle.
Bei Wahrnehmung des Schalls lassen sich demnach die Komponenten Direktschall und reflektierter Schall unterscheiden.
Zur Darstellung von natürlichen Hörumgebungen im Rahmen eines vollständigen 3-D-Audioprozeßsystems ist demnach auch eine binaurale und transaurale Transformation der Reflektionkomponenten erforderlich.
Der holophonische Hallprozessor bewirkt a] eine Erzeugung einer virtuellen dreidimensionalen Hörumgebung und b] die individuelle Plazierung von unterschiedlichen Signalquellen innerhalb dieses virtuellen Raums. Die Generierung der Raumsimulation erfolgt hierbei auf Mehrkanalbasis. Hierfür werden die frühen Reflektionen eines Schallereignisses innerhalb der Bearbeitung mit unterschiedlichen Richtungskoeffizienten in bezug auf das Reflektionsverhalten des virtuellen Raumes versehen und getrennt bearbeitet. Das Produkt der Hallbearbeitung der einzelnen Reflektion wird hierbei anhand der binauralen Außenohrübertragungsfunktion für die jeweilige virtuelle Schallrichtung bearbeitet.
Die Generierung des jeweiligen Mehrkanalsignals erfolgt hierbei durch virtuelle Lautsprecher und Mikrophone, wobei die Lautsprecher die Eingänge und die Mikrophone die Ausgänge des Schalls innerhalb des virtuellen Raumes darstellen. Der jeweilige Ausgang des virtuellen Mikrophons kann in der Ausgangsebene (Matrizierung) einem physikalischen elektrischen Ausgangskanal zugeordnet werden, wodurch wird die Anpassung an verschiedene Lautsprecherkonfigurationen, bzw. -Standards, wie "Dolby-Digital" ermöglicht wird.
Eine zweite, parallele Signalverarbeitungsebene dient der Erzeugung eines künstlichen diffusen Schallfeldes, welches durch die wiederholte Brechung und Reflektion von Schall innerhalb eines Raumes erzeugt wird. Die einzelnen Diffuskomponenten sind im Gegensatz zu den frühen Reflektionen für das menschliche Ohr nicht mehr ortbar, sondern treten vielmehr als homogenes Tongemisch auf (Hallfahne) .
Zeichnung
Weitere Vorteile und Merkmale der Erfindung sind Gegenstand der nachfolgenden Beschreibung sowie der zeichnerischen Darstellung eines Ausführungsbeispiels. Es zeigen:
Fig.l ein Blockschaltbild der Signalbearbeitung eines 3-D Audioprozessors nach dem Stand der
Technik
Fig.2 ein Blockschaltbild der Signalbearbeitung der Erfindung. Beschreibung des Ausführungsbeispiels
Wie in Fig.l dargestellt ist, wird das Signal zunächst in einer Eingangsstufe 11 bearbeitet.
Steht das Signal nicht auf digitaler Ebene zur Verfügung, so erfolgt eine A/D-Wandlung.
Das Signal wird auf digitaler Ebene einer binauralen Bearbeitung 13 unterzogen, wobei das monophone Signal in zwei gehörrichtig aufbereitete Signale verwandelt wird. Hierbei wird das Signal mit den Kopfübertragungsfunktionen (HRTF's) versehen, wobei die Art der Funktion anhand einer Kontrolleinheit vorgewählt wird. Eine transaurale Bearbeitung 14 sorgt durch Übersprech- kompensation für eine Dämpfung der Signalkomponenten, die bei der Stereowiedergabe vom rechten Lautsprecher auf das linke Ohr und vom linken Lautsprecher auf das rechte Ohr einfallen. Hierdurch wird eine kopfbezogene Entkopplung der beiden Kanäle in bezug auf ihre Signalquellen (Lautsprecher) und deren Anordnung vorgenommen, um eine Wiedergabe des binauralen Tonmaterials über Stereo-Lautsprecher zu ermöglichen.
Im Signalnalausgang 15 wird, falls die Signale nicht auf digitaler Ebene weitergeleitet werden sollen, eine D/A-Wandlung vorgenommen, um die beiden transformierten Signale als Analogsignal an ein Mischpult oder an einen Schallspeicher weiterzugeben. Ein mehrkanaliges Tonbearbeitungssystem, dargestellt in Fig. 2, umfasst zwei Signalverarbeitungsebenen, eine Direktsignalverarbeitungsebene 2 und eine Raumsimulationsebene 3, die für das klangliche Resultat verantwortlich sind, sowie eine spezielle, mehrkanalige Korrektureinheit für Lautsprecher 4.
Ein Stellglied 1 ist zur manuellen Einflußnahme auf die Bearbeitung des Systems vorgesehen, das in den drei räumlichen Ebenen arbeitet. Das zu bearbeitende Tonmaterial wird über die Ausspielwege eines Mischpultes den Eingangsstufen 18 und 20 der beiden Bearbeitungsebenen 2 und 3 zugeführt. Eine Mischstufe 19 ermöglicht die Weitergabe der Eingangssignale der Direktverarbeitung an die Raumsimulationsebene.
Signale, die nicht auf digitaler Ebene vorliegen, werden in den Eingangsstufen digital gewandelt. Die Eingangsstufen 18, 20 sind mehrkanalig ausgeführt, um a] in Verarbeitungsebene 2 eine unabhängige Bearbeitung und somit eine jeweils variable Position der einzelnen Tonsignale zu ermöglichen, b] auf der Ebene der Raumsimulation 3 eine unabhängige Bearbeitung und somit eine jeweils variable Position des einzelnen Tonsignals innerhalb eines virtuellen Raumes zu gewährleisten, und c] eine Erzeugung von unterschiedlichen virtuellen Räumen und Raumkombinationen, z.B. Raum im Raum für ein jeweiliges Signal zu ermöglichen.
Die manuelle Steuerung des Systems erfolgt durch einen speziellen, in drei Dimensionen arbeitenden Stellmecha- nismus 16 des speziellen Stellgliedes 1 . Bei der Betätigung des Stellmechanismus 16 wird die Position und die Geschwindigkeit der Positionsänderung von einer Erkennungseinheit 17 in Steuerbefehle umgesetzt. Die vertikal verlaufenden Pfeile zeigen die Einflußnahme der Steuerbefehle auf die jeweiligen Signalbearbeitungsgruppen 21, 22, 23, 24 sowie 32, 33, 34 und 35.
Die der Direktsignalverarbeitungsebene 2 folgende Doppler-Bearbeitung 21 dient zur Darstellung von akustischen Bewegungseffekten, wie sie u.a. bei der Filmton- Gestaltung Verwendung finden. Die Doppler-Bearbeitung geschieht ebenfalls in Abhängigkeit des Stellgliedes 1, wobei hier von der Erkennungseinheit 17 die Geschwindigkeit der Betätigung des Stellmechanismus bei der Positionsveränderung eines Schallsignals ausgewertet wird. Die Doppler-Bearbeitung 21 umfaßt die Funktionen der Tonbeugung und der Filterung des Schallsignals, wobei die Stärke der Tonbeugung, sowie die Art der Filterfunktion durch die Ausgangs- und Endposition und der Geschwindigkeit der Positionänderung des Stellmechanismus 16 des Stellgliedes 1 vorgegeben wird.
Die Direktsignalverarbeitungsebene 2 wird nach der Doppler-Bearbeitung einer binauralen Transformation unterzogen 22 , wobei, für jeden Kanal getrennt, das mo- nophone Signal gemäß den Kopfübertragungsfunktionen in ein zweikanaliges, binaurales Signal gewandelt wird. Die binaurale Bearbeitung des Signals erfolgt gemäß der Vorgabe des Stellgliedes 1, welches durch seine Position die Parameter der binauralen Bearbeitung bestimmt, um somit die virtuelle Plazierung eines Schallsignals in Relation zu der räumlichen Position des Stellmechanismus 16 zu ermöglichen. Die nachfolgende transaurale Bearbeitung 23 erfolgt, im Gegensatz zu der transauralen Bearbeitung nach dem Stand der Technik, ebenfalls in Abhängigkeit der Positionsvorgabe des Stellgliedes. Die Position bestimmt hier das Maß der transauralen Bearbeitung. Die transaurale Bearbeitung erfolgt zur Unterstützung der Pegelstellebene 24, durch die die Plazierung von Schallquellen innerhalb der Mehrlautsprecherebene (Surround-Ebene) erfolgt. Sie wird dann aktiviert, wenn Schallereignisse außerhalb dieser Ebene dargestellt werden sollen, aber auch, um das binaural transformierte Schallsignal von den Lautsprechern als ortbare Schallquelle zu entkoppeln. Raumsimulationsebene 3 dient zur virtuellen Gestaltung von Klangräumen, in denen die einzelnen Schallsignale, die durch die mehrkanalige Eingangsstufe 20 oder der Mischstufe 19 der Bearbeitung zugeführt werden, jeweils unabhängig voneinander positioniert werden können. Hierbei werden die Signale zwei unterschiedlichen Bearbeitungen unterzogen.
Eine Bearbeitung 31 dient der elektronischen Erzeugung eines diffusen Schallfeldes, daß durch mannigfache Brechung und Reflektion innerhalb eines natürlichen Raums entsteht (Hallfahne) .
Bearbeitungen 32,33,34,35 dienen der Verräumlichung und unabhängigen Wahl der Einfallsrichtungen der frühen Reflektionen, die in Abhängigkeit der Position des Stell- mechanismus 16 des Stellgliedes 1 geschieht, sowie der jeweils unabhängigen Positionierung der einzelnen Schallquellen innerhalb des virtuellen Raumes. Die Form der Verarbeitung erfolgt hierbei nach dem gleichen Muster wie die innerhalb der Direktsignalverarbeitungsebene 2. Zur Beseitigung von Störgrößen dient eine speziell an die Bearbeitungsprozesse des Systems angepaßte, mehrkanalige Lautsprecherkorrektur 4, 40. Die zur Wiedergabe dienenden Lautsprecher werden hierbei einer Phasen- und Frequenzgangkorrektur unterzogen, um eine bestmögliche, lineare Wiedergabe des transformierten Tonmaterials zu ermöglichen.

Claims

3. Patentansprüche
1. Mehrkanaliges Tonbearbeitungssystem für die Tonstudio- und elektroakustische Übertragungstechnik zur Gestaltung von virtuell-realen Hörumgebungen auf Basis von Mehrlautsprecherstandards, dadurch gekennzeichnet, daß die dimensionsgerechte Darstellung von Schallereignissen neben der binauralen und transauralen Bearbeitung durch eine den gewünschten Schallpositionen gemäßen Regulierung des Signalpegels innerhalb einer mehrkanaligen Lautsprecherumgebung erfolgt.
2. Tonbearbeitungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die Steuerung Signalverarbeitungsstufen durch ein in drei räumlichen Ebenen (vorne, hinten; oben, unten; rechts, links) arbeitendes Stellglied (1) erfolgt und die Positionierung der einzelnen Schallquelle über einen in drei räumlichen Ebenen arbeitenden Stellmechanismus (16) erfolgt.
3. Tonbearbeitungssystem nach Anspruch 2, dadurch gekennzeichnet, daß die relative räumliche Position des in den drei räumlichen Ebenen arbeitenden Stellmechanismus (16) des Stellgliedes (1) in bezug auf die Extrempositionen oben, unten; vorne, hinten; rechts, links mit der von einem Hörer wahrgenommenen virtuellen Position der Schallquelle in bezug auf die Extrempositionen oben, unten; vorne, hinten; rechts, links der akustischen Umgebung korrespondiert.
4. Tonbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß die Positionierung der virtuellen Schallquellen, die anhand der Positionierung des Stellmechanismus (16) des Stellgliedes (1) erfolgt, neben der binauralen und transauralen Bearbeitung, eine Bearbeitung des Signalpegels (24) umfaßt.
5. Tonbearbeitungssystem nach Anspruch 4, dadurch gekennzeichnet, daß die Pegelbearbeitung (24, 35) eine Matrizierung der einzelnen binaural und transaural bearbeiteten Mehrkanalsignale umfaßt, die die Regulierung der Pegelverhältnisse jeder einzelnen zu positionierenden Signalquellen innerhalb einer Mehrlautsprecheranordnung ermöglicht .
6. Tonbearbeitungssystem nach Anspruch 5, dadurch gekennzeichnet, daß Matrizieungseinheiten zur Anpassung der Arbeitsweise des Systems an jegliche Mehrlautsprecherkonfigurationen vollständig konfigurierbar gestaltet ist.
7. Tonbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß die Stärke der Amplitudenbearbeitung der Direktsignal- Bearbeitung in Abhängigkeit von der richtungsbildenden binauralen Bearbeitung erfolgt.
8. Tonbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß die Stärke der binauralen Bearbeitung der Direktsignalverarbeitung in Abhängigkeit von der richtungsbildenden Pegelbearbeitung erfolgt.
9. Tonbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß eine transaurale Bearbeitung (23) innerhalb der Direktsignal- Bearbeitungsebene nicht stetig erfolgt, sondern in ihrer Stärke als regulierbarer Parameter in Abhängigkeit von der Position des Stellgliedes erfolgt.
10.Tonbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß in die Bearbeitungsebene der Direktsignalbearbeitung eine Doppler-Bearbeitung (21) zur Simulation von bewegungsabhängigen akustischen Tonbeugungs- und Filtereffekten integriert ist.
11.Tonbearbeitungssystem nach Anspruch 10, dadurch ge¬ kennzeichnet, daß die Parametervorgabe der Doppler- Bearbeitung (21) mittels einer Analyseeinheit (17) zur Ermittlung der Geschwindigkeit der Positionsänderung des Stellmechanismus (16) des Stellgliedes (1) geschieht.
12. Tonbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß die Generie¬ rung der frühen Schallrückwürfe (32) innerhalb der elektronischen Raumsimulation einer binauralen einer transauralen und einer Signalpegel-Bearbeitung (33, 34) unterworfen werden.
13. Tonbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß die individuelle virtuelle Einfallsrichtung jedes einzelnen Schallrückwurfes anhand der Position des Stellmechanismus (16) des Stellgliedes (1) bestimmt werden kann.
14.Tonbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß die relative räumliche Position des in den drei räumlichen Ebenen arbeitenden Stellmechanismus (16) des Stellgliedes in bezug auf die Extrempositionen oben, unten; vorne, hinten; rechts, links mit der vom Hörer wahrgenommenen, virtuellen Einfallsrichtung des jeweiligen Schallrückwurfes in bezug auf die Extrempositionen oben, unten; vorne, hinten; rechts, links der akustischen Hörumgebung korrespondiert.
15.Tonbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß die transaurale Bearbeitung (34) der binaural bearbeiteten Schallrückwürfe innerhalb der Raumsimulationsebene nicht stetig, sondern in ihrer Stärke als regulierbarer Parameter in Abhängigkeit von der Position des Stellmechanismus (16) des Stellgliedes (1) erfolgt.
16. onbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß die Stärke der Pegelbearbeitung (35) bei der Positionierung der Erstreflektionen der Raumsimulation in Abhängigkeit von der richtungsbildenden binauralen Bearbeitung (33) geschieht.
17. onbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß die Stärke der binauralen Bearbeitung bei der Positionierung der Erstreflektionen der Raumsimulation in Abhängigkeit von der richtungsbildenden Pegelbearbeitung (35) geschieht.
18.Tonbearbeitungssystem nach einem der voranstehenden Ansprüche, dadurch gekennzeichnet, daß das System über eine speziell angepaßte, mehrkanalige Lautsprecherkorrektureinheit (4, 40) verfügt.
19. Tonbearbeitungssystem nach Anspruch 18, dadurch gekennzeichnet, daß die Lautsprecherkorrektureinheit (4, 40) vollständig kalibrierfähig ausgelegt ist und zur korrekten Arbeitsweise an alle Lautsprechertypen und Lautsprecherboxen anpaßbar ist.
20. Tonbearbeitungssystem nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß die Tonsignale für die Direktsignalverarbeitung (2) sowie für die Erzeugung von virtuellen Höhrräumen (3) einer jeweils physikalisch getrennten, unabhängigen, mehrkanaligen Eingangssufe zuführbar sind.
21. Tonbearbeitungssystem nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, daß die Eingangssignale der Eingangsstufe der Direktsignal- Bearbeitung mittels einer Mischstufe (19) unabhängig voneinander in den Signalpfad der Raumsimulation geleitet werden können.
22. Tonbearbeitungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die Signalausgabe des Systems über eine mehrkanalig ausgeführte, kalibrierfähige Ausgangsstufe (36) erfolgt.
EP00987030A 1999-11-03 2000-10-26 Mehrkanaliges tonbearbeitungssystem Withdrawn EP1410685A2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
DE19952835 1999-11-03
DE19952835 1999-11-03
DE19958105 1999-12-02
DE19958105A DE19958105A1 (de) 1999-11-03 1999-12-02 Mehrkanaliges Tonbearbeitungssystem
PCT/DE2000/003786 WO2001033907A2 (de) 1999-11-03 2000-10-26 Mehrkanaliges tonbearbeitungssystem

Publications (1)

Publication Number Publication Date
EP1410685A2 true EP1410685A2 (de) 2004-04-21

Family

ID=26055440

Family Applications (1)

Application Number Title Priority Date Filing Date
EP00987030A Withdrawn EP1410685A2 (de) 1999-11-03 2000-10-26 Mehrkanaliges tonbearbeitungssystem

Country Status (2)

Country Link
EP (1) EP1410685A2 (de)
WO (1) WO2001033907A2 (de)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9107011D0 (en) * 1991-04-04 1991-05-22 Gerzon Michael A Illusory sound distance control method
US5943427A (en) * 1995-04-21 1999-08-24 Creative Technology Ltd. Method and apparatus for three dimensional audio spatialization
GB9614078D0 (en) * 1996-07-04 1996-09-04 Central Research Lab Ltd Sound effect mechanism
JP3976360B2 (ja) * 1996-08-29 2007-09-19 富士通株式会社 立体音響処理装置
GB9726338D0 (en) * 1997-12-13 1998-02-11 Central Research Lab Ltd A method of processing an audio signal
GB2342830B (en) * 1998-10-15 2002-10-30 Central Research Lab Ltd A method of synthesising a three dimensional sound-field

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO0133907A3 *

Also Published As

Publication number Publication date
WO2001033907A2 (de) 2001-05-10
WO2001033907A3 (de) 2002-03-14

Similar Documents

Publication Publication Date Title
DE69726262T2 (de) Tonaufnahme- und -wiedergabesysteme
DE68922885T2 (de) Verfahren und Vorrichtung zur Schallbilderzeugung.
EP1652405B1 (de) Vorrichtung und verfahren zum erzeugen, speichern oder bearbeiten einer audiodarstellung einer audioszene
DE2244162C3 (de) «system
DE4241130B4 (de) Verfahren und Vorrichtung zur Wiedergabe von vierkanaligen Tonsignalen über einen Zweikanalkopfhörer bzw. über zwei Lautsprecher
DE19950319A1 (de) Verfahren zum Synthetisieren eines dreidimensionalen Schallfeldes
EP1671516A1 (de) Vorrichtung und verfahren zum erzeugen eines tieftonkanals
DE19952300A1 (de) Audioverarbeitungsgerät und Audiowiedergabeverfahren
DE102005003431B4 (de) Anordnung zum Wiedergeben von binauralen Signalen (Kunstkopfsignalen) durch mehrere Lautsprecher
Gierlich The application of binaural technology
DE102019135690A1 (de) Verfahren und Vorrichtung zur Audiosignalverarbeitung für binaurale Virtualisierung
DE102021203640B4 (de) Lautsprechersystem mit einer Vorrichtung und Verfahren zum Erzeugen eines ersten Ansteuersignals und eines zweiten Ansteuersignals unter Verwendung einer Linearisierung und/oder einer Bandbreiten-Erweiterung
EP1240805A2 (de) Verfahren und anlage zur aufnahme und wiedergabe von klängen
EP0156334B1 (de) Simulationsverfahren und Vorrichtung (elektronischer Kunstkopf) zur Nachbildung der Übertragungseigenschaften des menschlichen Aussenohrs bei Freifeldbeschallung
DE102021200555B4 (de) Mikrophon und Verfahren zum Aufzeichnen eines akustischen Signals
EP1410685A2 (de) Mehrkanaliges tonbearbeitungssystem
DE3512155A1 (de) Elektroakustische anordnung fuer richtungsorientiertes, raeumliches hoeren
DE19958105A1 (de) Mehrkanaliges Tonbearbeitungssystem
DE2023377C3 (de) Verfahren zur räumlichen Wiedergabe von Schallsignalen und Anordnung zu seiner Durchfuhrung
WO2007110087A1 (de) Anordnung zum wiedergeben von binauralen signalen (kunstkopfsignalen) durch mehrere lautsprecher
DE19628261A1 (de) Verfahren und Vorrichtung zum elektronischen Einbetten von Richtungseinsätzen bei Zweikanal-Ton
DE19514105A1 (de) Kopfhörer-Raumklanganpassungsschaltung
DE2126677B1 (de) Kopfhörer zur Wiedergabe stereophoner Darbietungen
AT391389B (de) Elektroakustische anordnung zur darbietung von audiosignalen fuer das richtungsorientierte raeumliche hoeren bei binauraler wiedergabe
EP2503799A1 (de) Verfahren und System zur Berechnung synthetischer Außenohrübertragungsfunktionen durch virtuelle lokale Schallfeldsynthese

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20020927

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20080502