WO2015049334A1 - Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals - Google Patents

Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals Download PDF

Info

Publication number
WO2015049334A1
WO2015049334A1 PCT/EP2014/071154 EP2014071154W WO2015049334A1 WO 2015049334 A1 WO2015049334 A1 WO 2015049334A1 EP 2014071154 W EP2014071154 W EP 2014071154W WO 2015049334 A1 WO2015049334 A1 WO 2015049334A1
Authority
WO
WIPO (PCT)
Prior art keywords
channel
signal
upmix
downmix
upmix signal
Prior art date
Application number
PCT/EP2014/071154
Other languages
English (en)
French (fr)
Inventor
Clemens Par
Original Assignee
Stormingswiss Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CH01727/13A external-priority patent/CH708710A1/de
Application filed by Stormingswiss Gmbh filed Critical Stormingswiss Gmbh
Priority to KR1020167011324A priority Critical patent/KR20160072131A/ko
Priority to US15/026,739 priority patent/US20160269847A1/en
Priority to KR1020167011299A priority patent/KR20160072130A/ko
Priority to CN201480065847.6A priority patent/CN106165453A/zh
Priority to AU2014331094A priority patent/AU2014331094A1/en
Priority to JP2016520036A priority patent/JP2016536855A/ja
Publication of WO2015049334A1 publication Critical patent/WO2015049334A1/de

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • G06F17/156Correlation function computation including computation of convolution operations using a domain transform, e.g. Fourier transform, polynomial transform, number theoretic transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Definitions

  • the invention relates to a method and a device for increasing the number of channels of a downmix signal by correlation comparison and pseudo-stereophony, in particular the inverse coding.
  • Audio multichannel signals require an amount of memory proportional to the number of channels for transmission and storage. Therefore, the amount of memory is often reduced by reducing the number of channels in a so-called downmix.
  • the amount of memory is often reduced by reducing the number of channels in a so-called downmix.
  • pseudostereophonic methods can be used which determine an additional channel from a channel of the downmix signal.
  • a special case of pseudostereophonic methods is inverse coding (a solution of inverse problems with spatial audio signals), which calculates the division of the signal components between a left and a right channel from a mono signal on the basis of geometrical parameters.
  • geometric parameters for example, the angle between a sound source and a main axis of a microphone and / or a fictitious opening angle of the microphone and / or come fictitious left opening angle of the microphone and / or a fictitious right opening angle and / or a
  • NHK 22.2 is a 22-channel audio surround sound standard with two low-frequency bass channels (also called Hamasaki 22.2), which is the standard used to derive the most common audio surround sound standards.
  • Fig. 1 shows diagrammatically the positions of the loudspeakers associated with the 24 channels of a multi-channel signal according to Hamasaki 22.2.
  • FIG. 1 shows a NHK-22.2 arrangement.
  • FIG. 2 shows an exemplary embodiment of a correlation equation.
  • FIG. 3 shows the spectral sign comparison for a correlation comparison.
  • FIG. 4 shows an embodiment for an inverse coding.
  • FIG. 6 shows a first exemplary embodiment of the downmix.
  • Fig. 7 shows a first embodiment of the upmix.
  • Fig. 8 shows a second embodiment of the downmix.
  • Fig. 9 shows a second embodiment of the upmix.
  • FIG. 10 shows a fifth exemplary embodiment of the downmix.
  • Fig. 11 shows a fifth embodiment of the upmix.
  • FIG. 12 shows a sixth exemplary embodiment of the downmix. • Fig. 13 shows a sixth embodiment of the upmix.
  • Fig. 14 shows an eighth embodiment of the downmix.
  • FIG. 15 shows an eighth embodiment of the upmix.
  • FIG. 16 shows a tenth embodiment of the downmix.
  • FIG. 17 shows a tenth embodiment of the upmix.
  • FIG. 18 shows an eleventh embodiment of the downmix.
  • FIG. 19 shows an eleventh embodiment of the upmix.
  • FIG. 20 shows a thirteenth embodiment of the downmix.
  • Fig. 21 shows a thirteenth embodiment of the upmix.
  • Fig. 22 shows a fourteenth embodiment of the downmix.
  • Fig. 23 shows a fourteenth embodiment of the upmix.
  • Fig. 1 shows a NHK-22.2 arrangement from which a variety of standards and marketed formats for "audio surround sound" can be derived, but for the sake of consistency, the same nomenclature of the NHK-22.2 standard is always used to In the following, only channel positions are referred to, meaning the position of a loudspeaker associated with the channel, and the positions in Fig. 1 are not intended to be exact or restrictive, but only the approximate relative position of the loudspeakers represent each other.
  • the NHK-22.2 system has three horizontal levels, called the bottom layer, the middle layer, and the top layer. Many other standards for "audio surround sound" have two - mostly the middle and the upper level - or three of these levels and should be referred to as such for all standards.
  • the middle level has the following channel positions (abbreviated in brackets): a front left channel (FL), a front central left channel (FLc), a front central channel (FC), a front central right channel (FRc), a front right channel (FR), a laterally right channel (SiR), a rear right channel (BR), a rear central channel (BC), a rear left channel (BL) and a left side channel (SiL).
  • the upper level has the following channel positions (abbreviated in parentheses): a front left channel (TpFL), a front central channel (TpFC), a front right channel (TpFR), a laterally right channel (TpSiR), a rear right Channel (TpBR), a rear central channel positions (abbreviated in parentheses): a front left channel (TpFL), a front central channel (TpFC), a front right channel (TpFR), a laterally right channel (TpSiR), a rear right Channel (TpBR), a rear central channel positions (abbreviated in parentheses): a front left channel (TpFL), a front central channel (TpFC), a front right channel (TpFR), a laterally right channel (TpSiR), a rear right Channel (TpBR), a rear central channel positions (abbreviated in parentheses): a front left channel (TpFL), a front central channel (TpFC), a front right channel
  • TpBC Traffic Control Channel
  • TpBL back left channel
  • TpSiL left side channel
  • the lower level has the following channels (abbreviations in parentheses): a front left channel (BtFL), a front center channel (BtFC), a front right channel (BtFR).
  • a first low-frequency channel (LFE1) and a second low-frequency channel (LFE2) which are each intended for a subwoofer.
  • FR front right channel
  • TpFR FRc
  • BtFR back right channels
  • a method of extracting at least one output from two input signals by: providing first frequency dependent input signal portions and second frequency dependent input signal portions for a plurality of frequencies; Comparing the signs of the first frequency dependent input signal component and the second frequency dependent input signal component of a frequency of the plurality of frequencies; Determining at least one of a first frequency-dependent individual signal component of a first individual signal, a second frequency-dependent
  • Correlation comparison of input signals Ii '(t) and ri' (t) to be subjected undergo a Fourier transformation if Li '(k) and Ri' (k) are not already in a Fourier space representation.
  • the correlation comparison has for each frequency k a sign comparison of the spectral values Li '(k) and Ri' (k) of the two input signals. If the real parts of Re (Li '(k)) and Re (Ri' (k)) both have the same sign, then Re (Ci (k)) corresponds to that real part of Re (Li '(k)) and Re (Ri '(k)) whose absolute value is smaller or closer to zero.
  • the described correlation comparison is theoretically exact when it comes to stationary signals, but this is often not the case for audio signals.
  • the error between the actual correlated signal and the correlated signal for non-stationary signals determined by the correlation comparison is referred to as Residual ⁇ .
  • Residual average correction is based on the idea that when the downmix signal, in which a first channel K1 is mixed to a second and a third channel K2 and K3, and a fourth channel K4, is mixed to a fifth channel K5 and a sixth channel K6, two correlation comparisons for the reconstruction of the first and fourth channels Kl ⁇ and K4 ⁇ is performed. For each correlation comparison, the residual ⁇ 1 and ⁇ 4 are determined, for example by
  • the sixth channel K6 may also correspond to the third channel K3 or the first channel K1 may correspond to the fourth channel K4. This principle can be generalized to three or four or more correlation comparisons.
  • Correlation comparisons which are also performed in the Upmixvorraum determined and averaged.
  • a plurality of channels determined by correlation comparison can be corrected in the upmix.
  • different subgroups of correlation comparisons are formed and for each subgroup an averaged residual AMU is transmitted.
  • all correlated signals determined from the correlation comparisons are corrected by the averaged residual AMU of that subgroup.
  • the correction can be carried out in the frequency domain or in the period.
  • the obtained upmix channels are not corrected or corrected by the described technology or another technology for residual correction.
  • the mverse coding is the special form of a pseudo-stereophonic method with which a parametric optimal distribution of signal components of a single channel on two channels can be calculated.
  • these parameters are mitübertragen with the downmix signal and optimally selected during the downmix based on the mixed channel. However, it is also possible to fix these parameters with the downmix and to find these fixed parameters for the upmix. It is also possible to choose optimal fixed parameters in the Upmix. It is also possible to up-mix the parameters based on the type of channel of the downmix signal to be subjected to the inverse coding. Suitable parameters are the angle between a sound source and a main axis of a microphone, an opening angle of the microphone, a fictitious left opening angle of the microphone, a fictitious right opening angle and / or a directional characteristic for the input signal in question.
  • At least a first gain of the inverse Coding and at least a first delay of the inverse coding on the basis of a sound source and a main axis of a microphone determined, possibly additionally on the basis of an opening angle of the microphone, in particular a fictitious left opening angle of the microphone and a fictitious right opening angle and / or a directional characteristic.
  • a first intermediate signal and a second intermediate signal are determined based on the at least one delay and the at least one inverse encoding gain, and the first channel and the second channel of the upmix are determined on the basis of the first intermediate signal and the second intermediate signal.
  • the inverse encoding is configured to generate the first channel and the second channel based on at least one weighting factor, respectively, by weighted addition and / or weighted subtraction of the first and second intermediate signals, respectively.
  • two delays are determined on the basis of the angle between the sound source and the main axis of the microphone, the left fictitious opening angle, the right fictitious opening angle and a directional characteristic and possibly additionally these two delays by a common time factor (s ) corrected.
  • Fig. 4 shows an example of such an inverse coding.
  • the solid arrow 1001 shows the addition of a 0.5 (-6dB) weighted channel on the arrow origin side to a channel on the arrow direction side for generating a channel of the downmix signal from the two mentioned channels.
  • the straight dashed line 1004 between the channels K1 and K3 means that a downmix signal with the channels K1 and K3 forms an upmix signal on the basis of the three channels K1, K3 and K2, K2 and / or K1 and / or K3 passing through a correlation comparison can be determined.
  • the channel K1 of the upmix signal is corrected by the channel K2 obtained by correlation comparison or the channel K4 obtained by correlation comparison.
  • the triangle 1006 means that from an existing channel Kl or K2 of a downmix signal, an upmix signal having a first channel K1 and a second channel K2 is obtained by inverse coding of the existing channel K1 or K2 of the downmix signal.
  • the triangle with dashed rectangle 1007 at K2 means that from an existing channel K2 of a downmix signal, an additional channel K1 of an upmix signal is obtained by inverse coding of the existing channel K2 of the downmix signal.
  • the existing channel K2 is also used for the upmix signal, or further processed to other channels of the upmix signal.
  • the multi-channel signal, the downmix signal and the upmix signal may possibly have additional channels.
  • Fig. 6 shows the downmix of the channels BtFL, BtFC, BtFR, FL, FLc, FC, FRc, FR, SiR, BR, BC, BL and SiL of the multi-channel signal.
  • the four channels of the downmix signal are determined as follows:
  • a front left downmix channel FL ' is formed of a linear combination of the channels FL, FLc, BtFL, BtFC, FC and SiL
  • a front right downmix channel FR' of a linear combination of channels FR, FRc, BtFR, BtFC, FC and SiR is formed
  • a rear right downmix channel BR 'from a linear combination of the channels BR, BC and SiR is formed
  • a rear left downmix channel BL' from a Linear combination of channels BL, BC and SiL is formed.
  • the four channels of the downmix can be further reduced by stereo masking in the dataset, for example by USAC v2 encoding, thus yielding two so-called Channel Pair Elements (CPEs).
  • CPEs Channel Pair Elements
  • FIG. 7 shows the upmix of the channels BtFL, BtFC, BtFR, FL, FLc, FC, FRc, FR, SiR, BR, BC, BL and SiL of the upmix signal from the channels FL ', FR', BL 'and BR' of FIG Downmix signal.
  • the corner channels FL '', FR '', BR '' and BL '' could be determined on the basis of the individual signal components from the correlation comparison, these central channels (as well as the corner channels FL ", FR", BR ", BL” or, in turn, resulting from these correlation comparisons FL, FR, BR, BL) could be corrected in one embodiment by a medium residual transmitted with the downmix signal
  • the corner channels FL, FR, BR, BL are obtained by correcting the corresponding channels of the downmix signal with the two adjacent central channels ie for FL ' is corrected with FC and SiL, and so on.
  • corner channels FL, FR, BR, BL could also be determined directly from the correlation comparisons as the corresponding individual signals (eg, by substituting one such correlation comparison) Corresponding corner channel FL ", FR", BR ", BL” is corrected for that adjacent central channel which does not originate from this correlation comparison).
  • P (BtFL) and P (FLc) yields:
  • FRc 0.7071 * Inv (FR, P (FRc)).
  • the output of the inverse coding is multiplied by a factor which is chosen here as 0.7071 (-3dB), but can also be chosen differently.
  • the 13 channels of the upmix signal can be based on BtFL, BtFC, BtFR, FL 'or FL' ', FLc, FC, FRc, FR' or FR '', SiR, BR 'or BR' ', BC, BL 'or BL' 'and determine SiL from the four channels of the downmix signal.
  • the downmix signal contains a subset of FL and FR, FC, BtFL, FLc, BtFC, FRc, BtFR or subsets thereof may be determined as described above, if these channels were downmixed to FL and FR.
  • FC, BtFL, FLc, BtFC, FRc, BtFR or subsets thereof may be determined as described above, if these channels were downmixed to FL and FR.
  • a multi-channel signal with k 9 channels in a downmixing device becomes
  • the multi-channel signal, the downmix signal and the upmix signal may have additional channels.
  • FIG. 8 shows the downmix of the channels TpFL, TpFC, TpFR, TpSiR, TpBR, TpBC, TPBL, TpSiL and TpC of the multi-channel signal.
  • the four channels of the downmix signal are determined as follows:
  • TpFL x TpFL + 0.5 * (TpC + TpSiL + TpFC)
  • TpFR x TpFR + 0.5 * (TpC + TpSiR + TpFC)
  • TpBL x TpBL + 0.5 * (TpC + TpSiL + TpBC)
  • TpBR x TpBR + 0.5 * (TpC + TpSiR + TpBC).
  • an upper front left downmix channel TpFL ' is formed of a linear combination of the channels TpFL, TpFC, TpC and TpSiL
  • an upper front right downmix channel TpFR' is formed of a linear combination of the channels TpFR, TpFC, TpC and TpSiR
  • the rear right downmix channel TpBR ' is formed from a linear combination of the channels TpBR, TpBC, TpC and TpSiR
  • an upper rear left downmix channel TpBL' is formed from a linear combination of the channels TpBL, TpBC, TpC and TpSiL.
  • the four channels of the downmix can be further reduced by stereo masking in the dataset, for example by USAC v2 encoding, thus yielding two so-called Channel Pair Elements (CPEs).
  • CPEs Channel Pair Elements
  • TpFL ', TpFR' K (TpFL ', TpFR') -> TpFC, (TpFL '', TpFR '') K (TpFR ', TpBR') -> TpSiR, (TpFR '', TpBR 'K (TpBR', TpBL ') -> TpBC, (TpBR '', TpBL '') K (TpBL ', TpFL') -> TpSiL, (TpBL '', TpFL '') performing the central channels TpFC, TpSiL, TpSiR, TpBC.
  • central channels (as well as the corner channels TpFL '', TpFR '', TpBR '', TpBL '' resulting from these correlation comparisons or the corner channels TpFL, TpFR, TpBR, TpBL which in turn result from these channels, could in one embodiment be replaced by a corrected downmix signal with transmitted mean residual.
  • the corner channels TpFL, TpFR, TpBR, TpBL are obtained by correcting the corresponding channels of the downmix signal TpFL ', TpFR', TpBR ', TpBL' with the two adjacent central channels, ie for TpFL 'is corrected with TpFC and TpSiL, etc.
  • these corner channels TpFL, TpFR, TpBR, TpBL could also be determined directly from the correlation comparisons as the corresponding individual signals (eg, if a corner channel TpFL '', TpFR '', TpBR '', TpBL '' originating from such a correlation comparison surrounds that adjacent central one Channel that does not originate from this correlation comparison).
  • a multi-channel signal with k 22 channels (NHK-22, 0 arrangement) in one
  • the multi-channel signal, the downmix signal and the upmix signal may possibly have additional channels. This is achieved by a combination of the first and second embodiments.
  • the multi-channel signal, the downmix signal and the upmix signal may possibly have additional channels.
  • the multi-channel signal has the channels FR, FC, FL, BL and BR.
  • Fig. 16 shows the downmix of the tenth embodiment.
  • the downmix signal has the channels FR ⁇ , FL ⁇ , BR and BL.
  • Fig. 17 shows the upmix of the channels FL, FC and FR of the upmix signal from FL 'and FR' of the downmix signal. This will be a correlation comparison
  • channels FR and FL of the upmix signal could also be determined on the basis of FR ⁇ corrected with FC and FL ⁇ corrected with FC.
  • an upmix signal is obtained with the channels FR, FC, FL, BR and BL.
  • channel pairs BR-BL and / or FR X -FL X of the downmix signal are subjected to stereo masking, for example USAC v2 encoding, thus yielding two so-called channel pair elements (CPEs).
  • the multi-channel signal, the downmix signal and the upmix signal may possibly have additional channels.
  • the multi-channel signal has the channels FR, FC, FL, BL, BR, TpFL, TpFC, TpFR, TpSiR, TpBR, TpBC, TpBL, TpSiL and TpC on.
  • the channels TpFL, TpFC, TpFR, TpSiR, TpBR, TpBC, TpBL, TpSiL and TpC are downconverted into the downmix signals TpFL ', TpFR', TpBL 'and TpBR' as shown in the second embodiment and in FIG.
  • the channels TpFL, TpFC, TpFR, TpSiR, TpBR, TpBC, TpBL, TpSiL and TpC of the upmix signal are determined from the channels TpFL ', TpFR', TpBL 'and TpBR' of the downmix signal as shown in the second embodiment and in FIG .
  • the channels FR, FC, FL, BL and BR are down-converted to the downmix signals FR ⁇ , FL ⁇ , BL and BR as shown in the tenth embodiment and in FIG. From the channels FR ⁇ , FL ⁇ , BL and BR of the downmix signal, as shown in the tenth embodiment and in Fig. 17, the channels FR, FC, FL, BL and BR of the upmix signal are determined.
  • a multi-channel signal with k 22 channels (NHK-22, 0 arrangement) in one
  • the multi-channel signal, the downmix signal and the upmix signal may possibly have additional channels.
  • FIG. 10 shows the downmix of the channels TpC, TpBC, BtFL, BtFC, BtFR, FL, FLc, FC, FRc, FR, SiR, BR, BC, BL and SiL of FIG
  • Multichannel signal The four channels of the downmix signal are determined as follows:
  • BR x BR + 0.5 * (SiR + 0.7071 * ((TpC * 0.5 * TpBC) + BC))
  • BL X BL + 0.5 * (SiL + 0.7071 * ((TpC * 0.5 * TpBC) + BC)).
  • the front left downmix channel FL 'and the front right downmix channel FR' as in the first Embodiment in Fig. 6 are determined.
  • the rear left downmix channel BL 'and the right rear downmix channel BR' are determined as in the first exemplary embodiment in FIG. 6, with the difference that additionally signal components of TpBC and TpC are contained in BR ⁇ and BL ⁇ .
  • FIG. 11 shows the upmix of the channels TpC, TpBC, BtFL, BtFC, BtFR, FL, FLc, FC, FRc, FR, SiR, BR, BC, BL and SiL of the upmix signal from the channels FL ', FR', BL ' and BR 'of the downmix signal.
  • the channels BtFL, BtFC, BtFR, FL, FLc, FC, FRc, FR, SiR, BR, BC, BL and SiL of the upmix signal are determined from the four channels of the downmix signal as in the first embodiment in FIG.
  • the inverse coding of the channel BC is now performed with the parameter set P (TpBC):
  • TpBC 0.7071 * Inv (BC, P (TpBC)).
  • the TpC is determined from a gain of the channel BC.
  • the 15 channels of the upmix signal can be calculated on the basis of TpC, TpBC, BtFL, BtFC, BtFR, FL 'and FL' ', see above, FLc, FC, FRc, FR' and FR '', SiR, BR, respectively 'or BR' ', BC, BL' and BL '' and determine SiL from the four channels of the downmix signal.
  • the downmix signal is a subset of FL and FR, FC, BtFL, FLc, BtFC, FRc, BtFR, or subsets thereof may be determined as described above, if these channels were downmixed to FL and FR.
  • Fig. 12 shows the downmix of the channels TpFL, TpFC, TpFR, TpSiR, TpBR, TpBL and TpSiL of the multi-channel signal.
  • the two channels of the downmix signal are determined as follows:
  • TpFL x TpFL + 0.5 * TpFC + TpSiL + 0.7071 * TpBL
  • TpFR x TpFR + 0.5 * TpFC + TpSiR + 0.7071 * TpBR.
  • an upper front left downmix channel TpFL ' is formed of a linear combination of the channels TpFL, TpFC, TpBL and TpSiL
  • an upper front right downmix channel TpFR' is formed of a linear combination of the channels TpFR, TpFC, TpBR and TpSiR.
  • the two channels of the downmix can be further reduced by stereo masking in the dataset, for example by USAC v2 encoding, thus yielding a so-called Channel Pair Element (CPE).
  • CPE Channel Pair Element
  • Fig. 13 shows the upmix of the channels TpFL, TpFC, TpFR, TpSiR, TpBR, TpBL and TpSiL of the upmix signal from the channels TpFL 'and TpFR' of the downmix signal.
  • TpFL ', TpFR' TpFC
  • TpFL TpFR
  • the channels TpFR and TpFL of the upmix signal could alternatively also be determined on the basis of TpFR x corrected with TpFC and TpFL ⁇ corrected with TpFC.
  • a first subset of the upmix signal is obtained with the channels TpFR, TpFC, TpFL.
  • the inverse coding of the channel TpFL with the parameter sets P (TpSiL) yields:
  • TpSiL In (TpFL, P (TpSiL)).
  • TpBL 0.7071 * In (TpSiL, P (TpBL)).
  • TpSiR Inv (TpFR, P (TpSiR)).
  • TpBR 0.7071 * Inv (TpSiR, P (TpBR))
  • the channel TpFC and the channels TpFL and TpFR of the upmix signal are obtained by correlation comparison, and the channels TpSiR, TpBR, TpBL and TpSiL are obtained by inverse coding.
  • a multi-channel signal with k 22 channels (NHK-22.2 arrangement) in one
  • the multi-channel signal, the downmix signal and the upmix signal may possibly have additional channels. This is achieved by a combination of the fifth and the sixth embodiment.
  • Fig. 14 shows the downmix of the channels FL, FC, FR, BR, BL, TpBC and TpC of the multi-channel signal.
  • Downmix signals are determined as follows:
  • a front left downmix channel FL ' is formed from a linear combination of the channels FL and FC
  • a front right downmix channel FR' is formed from a linear combination of the channels FR and FC
  • a rear right downmix channel BR 'from a linear combination of the channels BR, TpC and TpBC is formed
  • a back left downmix channel BL ' is formed of a linear combination of the channels BL, TpC and TpBC.
  • the four channels of the downmix signal can be further reduced by stereo masking pairs of channels in the amount of data, for example a USAC v2 encoding, thus yielding two so-called Channel Pair Elements (CPEs).
  • CPEs Channel Pair Elements
  • the central channel FC and the channels FL and FR or the central channel UpmixCenter and the channels BR and BL result, the channel UpmixCenter is only an intermediate signal and does not form a rear central channel (BC) of the upmix signal.
  • the channels FR and FL and the channels BR and BL of the upmix signal could alternatively also be corrected on the basis of FR ⁇ with FC and FL ⁇ corrected with FC and also on the basis of BR ⁇ corrected with BC and BL ⁇ corrected with BC be determined.
  • a first subset of the upmix signal is obtained with the channels FR, FC, FL as well as with the channels BR, BC, BL.
  • TpBC 0.5 * UpmixCenter.
  • the TpC is determined by a gain of the UpmixCenter greater than one or greater two or greater three or greater four or greater five and the TpBC by an attenuation with a gain factor less than 1.
  • the channels FR, FC and FL of the upmix signal and by correlation comparison of BL ⁇ and BR ⁇ receive the channels BR, BL, TpC and TpBC.
  • the multi-channel signal, the downmix signal and the upmix signal may possibly have additional channels.
  • the multi-channel signal has the channels FR, FC, FL, BL, BR, TpFL, TpFC, TpFR, TpSiR, TpBR, TpBC, TpBL, TpSiL and TpC.
  • the channels TpFL, TpFC, TpFR, TpSiR, TpBR, TpBL and TpSiL are down-converted into the two downmix signals TpFL 'and TpFR' as shown in the sixth embodiment and in FIG. From the channels TpFL 'and TpFR' of the downmix signal, the channels TpFL, TpFC, TpFR, TpSiR, TpBR, TpBL and TpSiL of the upmix signal are determined as shown in the sixth embodiment and in FIG.
  • the multichannel signal, the downmix signal and the upmix signal may be additional
  • Fig. 18 shows the downmix of the channels TpFL, TpFC, TpFR, TpBR, TpBL and TpC of the multi-channel signal.
  • Downmix signals are determined as follows:
  • TpFL x TpFL + 0.5 * TpFC
  • TpFR x TpFR + 0.5 * TpFC
  • TpBL x TpBL + 0.5 * TpC
  • TpBR x TpBR + 0.5 * TpC. That is, an upper front left downmix channel TpFL 'is formed of a linear combination of the channels TpFL and TpFC, an upper front right downmix channel TpFR' is formed of a linear combination of the channels TpFR and TpFC, an upper rear left downmix channel TpBL 'of a linear combination the channels TpBL and TpC is formed, and an upper rear right downmix channel TpBR 'from a linear combination of channels TpBR and TpC is formed.
  • the four channels of the downmix can be further reduced by stereo masking in the dataset, for example by USAC v2 encoding, thus yielding two so-called Channel Pair Elements (CPEs).
  • CPEs Channel Pair Elements
  • TpBL ', TpBR' TpC
  • TpBL, TpBR TpBL, TpBR
  • the channels TpFR and TpFL and the channels TpBR and TpBL of the upmix signal could alternatively also be corrected on the basis of TpFR x with TpFC and TpFL ⁇ corrected with TpFC or also on the basis of TpBR ⁇ corrected with TpBC and TpBL ⁇ corrected with TpBC be determined.
  • Multichannel signal, the downmix signal and the Upmixsignal may have additional channels.
  • Embodiment consists of a combination of the tenth and eleventh embodiments.
  • Multichannel signal, the downmix signal and the Upmixsignal may have additional channels.
  • Fig. 20 shows the downmix of the channels FL, FC, FR, BR, BL, TpBL, TpBR and TpC of the multi-channel signal.
  • Downmix signals are determined as follows:
  • a front left downmix channel FL ' is formed of a linear combination of the channels FL and FC
  • a front right downmix channel FR' is formed of a linear combination of the channels FR and FC
  • a rear left downmix channel BL ' is formed of a linear combination of the channels BL , TpBL and TpC
  • a back right downmix channel BR ' is formed from a linear combination of the channels BR, TpBR and TpC.
  • the four channels of the downmix signal can be further reduced by a stereo masking in the amount of data, for example by a USAC v2 encoding, resulting in two so-called Channel Pair Elements (CPEs).
  • CPEs Channel Pair Elements
  • Fig. 21 shows the upmix of the channels FL, FC, FR, BR, BL, TpBR, TpBL and TpC of the upmix signal from the channels BL ', BR', FL 'and FR' of the downmix signal.
  • the channel UpmixCenter only one Intermediate signal is and forms no rear central channel (BC) of the upmix signal, but rather the TpC of the upmix signal.
  • the channels FR and FL and the channels BR and BL of the upmix signal could alternatively also be corrected on the basis of FR ⁇ with FC and FL ⁇ corrected with FC or also on the basis of BR ⁇ corrected with UpmixCenter and BL ⁇ corrected with UpmixCenter be determined.
  • a first subset of the upmix signal is obtained with the channels FR, FC, FL and with the channels BR, BL and UpmixCenter.
  • the inverse coding of the channel BL with the parameter sets P (TpBL) yields:
  • TpBL 0.7071 * Inv (BL, P (TpBL)).
  • TpBR 0.7071 * Inv (BR, P (TpBR))
  • Multichannel signal, the downmix signal and the Upmixsignal may have additional channels.
  • Fig. 22 shows the downmix of the channels TpFL, TpFC and TpFR of the multi-channel signal.
  • the two channels of the downmix signal are determined as follows:
  • TpFL x TpFL + 0.5 * TpFC
  • TpFR x TpFR + 0.5 * TpFC.
  • an upper front left downmix channel TpFL ' is formed of a linear combination of the channels TpFL and TpFC
  • an upper front right downmix channel TpFR' is formed of a linear combination of the channels TpFR and TpFC.
  • the two channels of the downmix signal can be further reduced by stereo masking in the dataset, for example by USAC v2 encoding, thus yielding a so-called Channel Pair Element (CPE).
  • CPE Channel Pair Element
  • Fig. 23 shows the upmix of the channels TpFL, TpFC and TpFR of the upmix signal from the channels TpFL 'and TpFR' of the downmix signal. This is the correlation comparison
  • TpFL ', TpFR' TpFC
  • TpFL, TpFR TpFR
  • the channels TpFR and TpFL of the upmix signal could alternatively also be determined on the basis of TpFR x corrected with TpFC and TpFL ⁇ corrected with TpFC.
  • the multi-channel signal, the downmix signal and the upmix signal may possibly have additional channels.
  • the fifteenth embodiment is a combination of the thirteenth and fourteenth embodiments.
  • Embodiments falling within the scope of the claims are disclosed both as an embodiment and as a disclaimer. That is, the scope of protection afforded by the claims may be divided into the embodiments disclosed in CH00743 / 14 and the embodiments covered by the scope of the protection, less the embodiments disclosed in CH00743 / 14 (individually, all together or in any combination). remaining protection area.
  • Embodiments falling within the scope of the claims are disclosed both as an embodiment and as a disclaimer. That is, the scope of protection afforded by the claims may be divided into the embodiments disclosed in CH0369 / 14 and the scope of protection afforded by the scope of protection minus the embodiments disclosed in CH0369 / 14 (individually, all together or in any combination) / remaining protection area.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Verfahren zum Upmixen eines Downmixsignals mit einem ersten Kanal und einem zweiten Kanal in ein Upmixsignal aufweisend die Schritte: Durchführen eines Korrelationsvergleichs zur Bestimmung korrelierter Signalanteile des ersten Kanals und des zweiten Kanals des Downmixsignals, wobei ein erster Kanal des Upmixsignals auf der Basis des ersten Kanals des Downmixsignals, ein zweiter Kanal des Upmixsignals auf der Basis des zweiten Kanals des Downmixsignals und ein dritter Kanal des Upmixsignals auf der Basis der korrelierten Signalanteile bestimmt wird; Bestimmen zumindest eines vierten Kanals des Upmixsignals durch inverse Kodierung des ersten Kanals, des zweiten Kanals oder des dritten Kanals des Upmixsignals.

Description

Verfahren und Vorrichtung zum Downmixen eines MultikanalSignals und zum Upmixen eines Downmixsignals
Die Erfindung betrifft ein Verfahren und eine Vorrichtung um die Anzahl der Kanäle eines Downmixsignals durch Korrelationsvergleich und PseudoStereophonie, insbesondere die inverse Kodierung, zu erhöhen.
Audiomultikanalsignale benötigen eine zu der Kanalzahl proportionale Speichermenge zum Übertragen und zum Speichern. Deshalb wird die Speichermenge oft durch eine Reduzierung der Kanalzahl in einem sogenannten Downmix reduziert. Zur Rekonstruktion des originalen Audiomultikanalsignals gibt es im Stand der Technik verschiedene Verfahren.
Es ist einerseits bekannt, aus zwei Kanälen einen zusätzlichen zwischen zwei Kanälen liegenden Kanal auf der Basis der in den zwei Kanälen gemeinsam vorkommenden Signalanteilen zu erzeugen. Dazu wird ein Korrelationsvergleich durchgeführt, mit dessen Hilfe die korrelierten Signalanteile extrahiert werden, und so der zusätzliche Kanal auf der Basis der korrelierten Signalanteile ermittelt wird.
Alternativ können sogenannte pseudostereophone Verfahren verwendet werden, die einen zusätzlichen Kanal aus einem Kanal des Downmixsignals ermitteln.
Ein Sonderfall pseudostereophoner Verfahren ist die inverse Kodierung (eine Lösung inverser Probleme bei räumlichen Audiosignalen) , die auf der Basis von geometrischen Parametern die Aufteilung der Signalanteile zwischen einem linken und einem rechten Kanal aus einem Monosignal berechnet. Als geometrische Parameter kommen z.B. der Winkel zwischen einer Schallquelle und einer Hauptachse eines Mikrophons und/oder ein fiktiver Öffnungswinkel des Mikrophons und/oder ein fiktiver linker Öffnungswinkel des Mikrophons und/oder ein fiktiver rechter Öffnungswinkel und/oder eine
Richtcharakteristik des Mikrophons in Frage. Diese Parameter können entweder mit dem Downmixsignal mit übertragen werden oder können fix in Abhängigkeit der in dem Downmix verwendeten Parameter gewählt werden, oder können auch als Defaultwerte festgelegt werden. Eine inverse Kodierung ist zum Beispiel in WO2009138205 offenbart. NHK 22.2 ist ein Standard für „Audio Surround Sound" mit 22 Kanälen und mit zwei niederfrequenten Bass-Kanälen (auch Hamasaki 22.2 genannt) . Aus diesem Standard lassen sich die meisten gängigen Standards für „Audio Surround Sound" herleiten. Fig. 1 zeigt schematisch die Positionen der den 24 Kanälen eines Multikanalsignals nach Hamasaki 22.2 zugeordneten Lautsprecher. Für einen Downmix eines solchen Multikanalsignals mit 24 Kanälen gibt es nun unzählige Möglichkeiten, die bekannten Verfahren wie
Korrelationsvergleich und die zahlreichen pseudostereophonen Verfahren zu kombinieren, um die 24 Kanäle wiederherzustellen. Ähnliche Probleme treten auch für die Wiederherstellung von Audiomultikanalsignalen anderer Standards oder im Markt vertretener Audioformate aus einem Downmix auf. Deshalb ist es Aufgabe der Erfindung, ein optimales Verfahren zur Erzeugung eines Upmixsignals zu finden, um ein qualitativ optimales Upmixsignal zu erhalten.
Die Aufgabe ist durch die unabhängigen Ansprüche gelöst.
Weitere Ausführungsformen sind in den abhängigen Ansprüchen beschrieben . Verschiedene Ausführungsformen der vorliegenden Erfindung werden im Folgenden beispielhaft beschrieben, wobei auf folgende Zeichnungen Bezug genommen wird:
• FIG. 1 zeigt eine NHK-22.2-Anordnung .
• FIG. 2 zeigt ein Ausführungsbeispiel für einen Korrelations ergleich .
• Fig. 3 zeigt den spektralen Vorzeichenvergleich für einen Korrelationsvergleich .
• Fig. 4 zeigt ein Ausführungsbeispiel für eine inverse Kodierung .
• Fig. 5 zeigt die in den Folgenden Figuren verwendeten Zeichen .
• Fig. 6 zeigt ein erstes Ausführungsbeispiel des Downmix.
• Fig. 7 zeigt ein erstes Ausführungsbeispiel des Upmix.
• Fig. 8 zeigt ein zweites Ausführungsbeispiel des Downmix.
• Fig. 9 zeigt ein zweites Ausführungsbeispiel des Upmix.
• Fig. 10 zeigt ein fünftes Ausführungsbeispiel des Downmix .
• Fig. 11 zeigt ein fünftes Ausführungsbeispiel des Upmix.
• Fig. 12 zeigt ein sechstes Ausführungsbeispiel des Downmix . • Fig. 13 zeigt ein sechstes Ausführungsbeispiel des Upmix.
• Fig. 14 zeigt ein achtes Ausführungsbeispiel des Downmix.
• Fig. 15 zeigt ein achtes Ausführungsbeispiel des Upmix.
• Fig. 16 zeigt ein zehntes Ausführungsbeispiel des Downmix .
• Fig. 17 zeigt ein zehntes Ausführungsbeispiel des Upmix.
• Fig. 18 zeigt ein elftes Ausführungsbeispiel des Downmix.
• Fig. 19 zeigt ein elftes Ausführungsbeispiel des Upmix.
• Fig. 20 zeigt ein dreizehntes Ausführungsbeispiel des Downmix .
Fig. 21 zeigt ein dreizehntes Ausführungsbeispiel des Upmix .
Fig. 22 zeigt ein vierzehntes Ausführungsbeispiel des Downmix .
Fig. 23 zeigt ein vierzehntes Ausführungsbeispiel des Upmix .
Fig. 1 zeigt eine NHK-22.2-Anordnung aus der sich eine Vielzahl von Standards und im Markt vertretener Formate für „Audio Surround Sound" ableiten lassen. Aus Gründen der Einheitlichkeit soll aber immer die gleiche Nomenklatur des NHK-22.2 Standards verwendet werden, um keine Verwirrung zu stiften. Im Folgenden wird immer nur von Kanalpositionen gesprochen, wobei damit die Position eines dem Kanal zugeordneten Lautsprechers gemeint ist. Die Positionen in Fig. 1 sollen dabei weder exakt noch einschränkend sein, sondern nur die ungefähre relative Position der Lautsprecher zueinander darstellen. Das NHK-22.2 System weist drei horizontale Ebenen auf, die als untere Ebene (Bottom Layer) , mittlere Ebene (Middle Layer) und obere Ebene (Top Layer) bezeichnet werden. Viele andere Standards für „Audio Surround Sound" weisen zwei - meist die mittlere und die obere Ebene - oder auch drei dieser Ebenen auf und sollen für alle Standards als solche bezeichnet werden.
Im Folgenden werden die einzelnen Kanalpositionen des NHK-22.2 Systems kurz eingeführt.
Die mittlere Ebene weist dabei die folgenden Kanalpositionen (Abkürzung in Klammern) auf: einen vorderen linken Kanal (FL), einen vorderen zentral linken Kanal (FLc) , einen vorderen zentralen Kanal (FC) , einen vorderen zentral rechten Kanal (FRc) , einen vorderen rechten Kanal (FR) , einen seitlich rechten Kanal (SiR) , einen hinteren rechten Kanal (BR) , einen hinteren zentralen Kanal (BC) , einen hinteren linken Kanal (BL) und einen seitlich linken Kanal (SiL) .
Die obere Ebene weist dabei die folgenden Kanalpositionen (Abkürzung in Klammern) auf: einen vorderen linken Kanal (TpFL) , einen vorderen zentralen Kanal (TpFC) , einen vorderen rechten Kanal (TpFR) , einen seitlich rechten Kanal (TpSiR) , einen hinteren rechten Kanal (TpBR) , einen hinteren zentralen
Kanal (TpBC) , einen hinteren linken Kanal (TpBL) und einen seitlich linken Kanal (TpSiL) .
Die untere Ebene weist die folgenden Kanäle auf (Abkürzungen in Klammern) : einen vorderen linken Kanal (BtFL) , einen vorderen zentralen Kanal (BtFC) , einen vorderen rechten Kanal (BtFR) . Zusätzlich gibt es noch einen ersten niederfrequenten Kanal (LFE1) und einen zweiten niederfrequenten Kanal (LFE2), welche jeweils für einen Subwoofer bestimmt sind. Wenn im Folgenden Verfahren und/oder Vorrichtungen zum Upmixen für bestimmte Kanäle des NHK-22.2-Systems dargestellt werden, so sind diese Verfahren nicht nur für NHK-22.2, sondern für alle Standards und im Markt vertretener Formate, die diese Kanäle enthalten, anwendbar. Wenn im Folgenden von einem vorderen rechten Kanal die Rede ist, ist dies nicht nur auf FR beschränkt, sondern beinhaltet auch TpFR, FRc und BtFR, die alle vordere rechte Kanäle sind, ausser es ist aus dem Kontext eindeutig, dass nur der Kanal FR gemeint sein kann. Dies gilt analog für alle anderen Kanäle.
Im Folgenden sollen kurz die für den Downmix und den Upmix verwendeten Technologien vorgestellt werden.
Es gibt viele Möglichkeiten, den bereits erwähnten Korrelationsvergleich durchzuführen. Ohne Beschränkung der Erfindung wird im Folgenden vorzugsweise das folgende Verfahren zur Bestimmung der korrelierten Signale und/oder der individuellen Signale zweier Eingangssignale verwendet. Verfahren zur Extraktion mindestens eines Ausgangssignals aus zwei Eingangssignalen durch: Bereitstellen erster frequenzabhängiger Eingangssignalanteile und zweiter frequenzabhängiger Eingangssignalanteile für eine Vielzahl von Frequenzen; Vergleichen der Vorzeichen des ersten frequenzabhängigen Eingangssignalanteils und des zweiten frequenzabhängigen Eingangssignalanteils einer Frequenz der Vielzahl von Frequenzen; Bestimmen zumindest eines aus einem ersten frequenzabhängigen Individualsignalanteil eines ersten Individualsignals , einem zweiten frequenzabhängigen
Individualsignalanteil eines zweiten Individualsignals und einem gemeinsamen frequenzabhängigen Signalanteil der Frequenz der Vielzahl von Frequenzen auf der Basis des Vorzeichenvergleichs; Bestimmung des mindestens einen Ausgangssignals auf der Basis von den ersten frequenzabhängigen Individualsignalanteilen der Vielzahl von Frequenzen und/oder den zweiten frequenzabhängigen Individualsignalanteilen der Vielzahl von Frequenzen und/oder den gemeinsamen (auch als „korreliert" bezeichnet) frequenzabhängigen Signalanteilen der Vielzahl von Frequenzen. Fig. 2 zeigt ein Schema für einen solchen bevorzugten Korrelationsvergleich. Dazu werden die dem
Korrelationsvergleich zu unterziehenden Eingangssignale Ii' (t) und ri' (t) , z.B. Kanäle aus dem Downmix oder daraus gewonnene Signale, einer Fouriertransformation unterzogen, falls Li' (k) und Ri' (k) sich nicht bereits in einer Fourierraumdarstellung befinden. Der Korrelationsvergleich weist für jede Frequenz k einen Vorzeichenvergleich der Spektralwerte Li' (k) und Ri' (k) der beiden Eingangssignale auf. Haben die Realteile von Re (Li' (k) ) und Re (Ri' (k) ) beide das gleiche Vorzeichen, so entspricht Re(Ci(k)) jenem Realteil von Re (Li' (k) ) und Re (Ri' (k) ) , dessen Absolutbetragswert kleiner ist bzw. der näher an der Null ist. Der Realteil des individuellen Signals Re(Li(k)) und Re(Ri(k)), welches dem absolut grösseren Realteil von Re (Li' (k) ) und Re (Ri' (k) ) zugeordnet ist, entspricht der Differenz der beiden Realteile (so dass das Vorzeichen des Realteils des individuellen Signals dem diesen zugeordneten Realteil des Eingangssignals entspricht) . Der andere Realteil der beiden individuellen Signale ist Null. Dies ist in Fig. 3 in Fall 1 bis 4 dargestellt. Haben die Realteile von Re (Li' (k) ) und Re (Ri' (k) ) unterschiedliche Vorzeichen, so ist der Realteil des korrelierten Signals Re(Ci(k))=0 und für die Realteile des individuellen ersten und zweiten Signals gilt:
Re (Li (k) ) =Re (L±' (k) ) und Re (R± (k) ) =Re (R±' (k) ) Dies ist in Fig. 3 in den Fällen 5 bis 8 dargestellt. Das gleiche wird auch für den Imaginärteil des korrelierten Signals Im(Ci(k)) und der individuellen Signale Im(Li(k)) und Im(Ri(k)) und für jede Frequenz k durchgeführt. Falls das korrelierte Signal Ci(k) und die individuellen Signale Li(k) und R±(k) im Zeitraum benötigt werden, werden diese mit einer inversen Fouriertransformation (IFFT) in den Zeitraum zurücktransformiert. Je nach Anwendung können mit diesem Verfahren ein, zwei oder drei Signale aus Li(k), R±(k) und Ci(k) bestimmt werden.
Der beschriebene Korrelationsvergleich ist theoretisch exakt, wenn es sich um stationäre Signale handelt, was aber für Audiosignale oft nicht der Fall ist. Der Fehler zwischen dem tatsächlichen korrelierten Signal und dem durch den Korrelationsvergleich ermittelten korrelierten Signal für nicht-stationäre Signale wird als Residual Δ bezeichnet. Wenn nun das Residual für jeden Korrelationsvergleich mit übertragen wird, so wird jeder durch den Downmix reduzierter Kanal wieder durch einen Kanal für das Residual ersetzt, und somit keine Datenreduktion erhalten. Im Folgenden werden verschiedene Technologien zum Korrigieren des Residuais für den Upmix beschrieben. Eine Residualmittelwertskorrektur basiert auf der Idee, dass bei Erzeugung des Downmixsignals , bei der ein erster Kanal Kl auf einen zweiten und einen dritten Kanal K2 und K3 gemischt wird, und ein vierter Kanal K4 auf einen fünften Kanal K5 und einen sechsten Kanal K6 gemischt wird, zwei Korrelationsvergleiche zur Rekonstruktion des ersten und vierten Kanals Kl λ und K4 λ durchgeführt wird. Für jeden Korrelationsvergleich wird das Residual Δ1 und Δ4 bestimmt, z.B. durch
Δ1=0.5* (Kl λ-Κ1) und Δ4=0.5* (K4 λ-Κ4) , und daraus ein gemitteltes Residual ΔΜ errechnet. Dabei kann der sechste Kanal K6 auch dem dritten Kanal K3 entsprechen oder der erste Kanal Kl dem vierten Kanal entsprechen K4. Dieses Prinzip kann auf drei oder vier oder mehr Korrelationsvergleiche verallgemeinert werden. Dabei werden in einer Downmixvorrichtung die Residuale für die
Korrelationsvergleiche, die auch in der Upmixvorrichtung durchgeführt werden, bestimmt und gemittelt. Somit kann durch die Übertragung eines gemittelten Residuais ΔΜ eine Vielzahl von durch Korrelationsvergleich bestimmten Kanälen im Upmix korrigiert werden. Es ist auch möglich, dass verschiedene Untergruppen von Korrelationsvergleichen gebildet werden und für jede Untergruppe ein gemitteltes Residual AMU übertragen wird. In jeder Untergruppe werden alle aus den Korrelationsvergleichen ermittelten korrelierten Signale durch das gemittelte Residual AMU dieser Untergruppe korrigiert. Wenn das Residual wie oben beschrieben berechnet wird, so wird das korrigierte korrelierte Signal ck vorzugsweise ausgeführt durch ck = c + 2*ΔΜ, wobei c das aus dem Korrelationsvergleich bestimmte korrelierte/gemeinsame Signal und ΔΜ das gemittelte Residual ist .
Ähnliches gilt für den zweiten und einen dritten Kanal K2 und K3 bzw. für den fünften Kanal K5 und den sechsten Kanal K6, die aufgrund desselben Korrelationsvergleichs dasselbe Residual Δ1 bzw. Δ4 aufweisen, welche durch das gemittelte Residual ΔΜ korrigiert werden können. Die korrigierten Signale lk und rk werden vorzugsweise ausgeführt durch lk = 1 - ΔΜ und
rk = r - ΔΜ .
Die Korrektur kann im Frequenzraum oder im Zeitraum durchgeführt werden. Für Details wird auf die unveröffentlichte schweizerische Patentanmeldung CH2013/1727 verwiesen, dessen Inhalt für die Residualmittelwertskorrektur per Referenz hier eingefügt wird. Wenn im Folgenden Ausführungsbeispiele mit durch Korrelationsvergleich erhaltenen Upmixkanälen verwendet werden, so ist es möglich, dass die erhaltenen Upmixkanäle nicht korrigiert werden oder durch die beschriebene Technologie oder eine weitere Technologie zur Residualkorrektur korrigiert werden.
Die mverse Kodierung ist die Sonderform eines pseudostereophonen Verfahrens, mit dem parametrisch eine optimale Aufteilung von Signalanteilen eines Monokanals auf zwei Kanäle errechnet werden kann. In einem
Ausführungsbeispiel werden diese Parameter mit dem Downmixsignal mitübertragen und während des Downmix auf der Basis des aufgemischten Kanals optimal gewählt. Allerdings ist es auch möglich, diese Parameter mit dem Downmix fest zu wählen und für den Upmix diese fest gewählten Parameter zu finden. Es ist auch möglich, im Upmix optimale feste Parameter zu wählen. Es ist auch möglich, im Upmix die Parameter auf der Basis der Art des Kanals des Downmixsignals , der der inversen Kodierung unterzogen werden soll, zu wählen. Als Parameter kommen der Winkels zwischen einer Schallquelle und einer Hauptachse eines Mikrophons, ein Öffnungswinkel des Mikrophones, ein fiktiver linken Öffnungswinkel des Mikrophones, ein fiktiver rechter Öffnungswinkel und/oder eine Richtcharakteristik für das Eingangssignal in Frage. Vorzugsweise wird zumindest ein erster Gain der inversen Kodierung und zumindest ein erster Delay der inversen Kodierung auf der Basis einer Schallquelle und einer Hauptachse eines Mikrophons bestimmt, evtl. zusätzlich auf der Basis eines Öffnungswinkels des Mikrophones, insbesondere eines fiktiven linken Öffnungswinkels des Mikrophones und eines fiktiven rechten Öffnungswinkels und/oder einer Richtcharakteristik. Ein erstes Zwischensignal und ein zweites Zwischensignal wird auf der Basis des mindestens einen Delays und des zumindest einen Gains der inversen Kodierung bestimmt, und der erste Kanal und der zweite Kanal des Upmix wird auf der Basis des ersten Zwischensignals und des zweiten Zwischensignals bestimmt. In einem Ausführungsbeispiel ist die inverse Kodierungung ausgebildet, auf der Basis zumindest eines Gewichtungsfaktors den ersten Kanal und den zweite Kanal jeweils durch gewichtete Addition und/oder gewichtete Subtraktion des ersten und zweiten Zwischensignals zu erzeugen. In einem Ausführungsbeispiel werden in der inversen Kodierung zwei Delays auf der Basis des Winkels zwischen der Schallquelle und der Hauptachse des Mikrophons, des linken fiktiven Öffnungswinkels, des rechten fiktiven Öffnungswinkels und einer Richtcharakteristik bestimmt und evtl. zusätzlich diese zwei Delays durch einen gemeinsamen Zeitfaktor (s) korrigiert. Fig. 4 zeigt ein Beispiel für eine solche inverse Kodierung. Details zu der Ausführung einer inversen Kodierung finden sich in den Anmeldungen EP1850629 oder WO2009138205 oder WO2011009649 oder WO2011009650 oder WO2012016992 oder WO2012032178, deren Inhalt zu der inversen Kodierung hiermit per Referenz einfügt wird. Eine weitere Möglichkeit zur Reduzierung der Datenmenge ist die sogenannte Maskierung. Dadurch werden vom Ohr nicht hörbare Frequenzen aus den Audiokanälen herausgefiltert. Dies wird sowohl für einzelne Kanäle (Monomaskierung) als auch für Kanalpaare (Stereomaskierung) durchgeführt. Ein Beispiel für eine Maskierung ist „Unified Speech and Audio Coding v2" (USAC v2) .
Im Folgenden werden verschiedene Ausführungsbeispiele beschrieben zum Downmixen eines Multikanalsignals mit k Kanälen in ein Downmixsignal mit m<k Kanälen und Upmixen des Downmixsignals in ein Upmixsignal mit n Kanälen, wobei für diese Ausführungsbeispiele m<n<=k gilt. Durch geschickte Kombination der beschriebenen Vorgänge ist auch m<k<=n möglich, was leicht einzusehen ist, sofern man beispielsweise ein oder mehrere Ausgangskanäle zusätzlich einer inversen Kodierung unterwirft. Diese Downmix- und Upmixvorgänge werden schematisch in den nachfolgenden Figuren dargestellt. Fig. 5 zeigt die in den folgenden Figuren verwendeten Zeichen. Der durchgezogene Pfeil 1001 zeigt die Addition eines mit 0.5 (-6dB) gewichteten, auf der Pfeilursprungsseite befindlichen Kanals zu einem auf der Pfeilrichtungsseite befindlichen Kanal zur Erzeugung eines Kanals des Downmixsignals aus den beiden genannten Kanälen. Das gleiche gilt für den gestrichelten Pfeil 1002, wobei hier anstatt des Gewichtungsfaktors 0.5 (- 6dB) ein Gewichtungsfaktor von 0.7071 (-3dB) verwendet wird. Das gleiche gilt für den gestrichelt gepunkteten Pfeil 1003, wobei hier anstatt des Gewichtungsfaktors 0.5 (-6dB) ein Gewichtungsfaktor von 1 (OdB) verwendet wird. Die gerade gestrichelte Linie 1004 zwischen den Kanälen Kl und K3 heisst, dass aus einem Downmixsignal mit den Kanälen Kl und K3 ein Upmixsignal auf der Basis der drei Kanäle Kl, K3 und K2 gebildet wird, wobei K2 und/oder Kl und/oder K3 durch einen Korrelationsvergleich ermittelt werden. Werden zwei Korrelationsvergleiche 1005 mit einem gemeinsamen Kanal Kl durchgeführt, so wird der Kanal Kl des Upmixsignals durch den durch Korrelationsvergleich gewonnenen Kanal K2 oder den durch Korrelationsvergleich gewonnenen Kanal K4 korrigiert. Das Dreieck 1006 heisst, dass aus einem bestehenden Kanal Kl oder K2 eines Downmixsignals ein Upmixsignal mit einem ersten Kanal Kl und einem zweiten Kanal K2 durch inverse Kodierung des bestehenden Kanals Kl oder K2 des Downmixsignals erhalten wird. Das Dreieck mit dem gestrichelten Rechteck 1007 bei K2 heisst, dass aus einem bestehenden Kanal K2 eines Downmixsignals ein zusätzlicher Kanal Kl eines Upmixsignals durch inverse Kodierung des bestehenden Kanals K2 des Downmixsignals erhalten wird. Der bestehende Kanal K2 wird auch für das Upmixsignal verwendet, bzw. zu weiteren Kanälen des Upmixsignals weiterverarbeitet.
In einem ersten Ausführungsbeispiel wird ein Multikanalsignal mit k=13 Kanälen in einer Downmixvorrichtung in ein Downmixsignal mit m=4 Kanälen downgemixt und darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in ein Upmixsignal mit n=13 Kanälen upgemixt. Dabei können das Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen. Fig. 6 zeigt den Downmix der Kanäle BtFL, BtFC, BtFR, FL, FLc, FC, FRc, FR, SiR, BR, BC, BL und SiL des Multikanalsignals . Die vier Kanäle des Downmixsignals werden wie folgt bestimmt:
FL x=FL+0.7071*FLc+0.7071*BtFL+0.5* ( 0.7071 *BtFC+FC) +0.5* SiL FRx=FR+0.7071*FRc+0.7071*BtFR+0.5* ( 0.7071 *BtFC+FC) +0.5* SiR
BRx=BR+0.5*BC+0.5* SiR
BL x=BL+0.5*BC+0.5* SiL.
Das heisst, dass ein vorderer linker Downmixkanal FL' aus einer Linearkombination der Kanäle FL, FLc, BtFL, BtFC, FC und SiL gebildet wird, ein vorderer rechter Downmixkanal FR' aus einer Linearkombination der Kanäle FR, FRc, BtFR, BtFC, FC und SiR gebildet wird, ein hinterer rechter Downmixkanal BR' aus einer Linearkombination der Kanäle BR, BC und SiR gebildet wird und ein hinterer linker Downmixkanal BL' aus einer Linearkombination der Kanäle BL, BC und SiL gebildet wird. Die vier Kanäle des Downmix können weiter durch eine Stereomaskierung in der Datenmenge reduziert werden, beispielsweise durch eine USAC v2 Enkodierung, und ergeben somit zwei sogenannte Channel Pair Elements (CPEs) .
Fig. 7 zeigt den Upmix der Kanäle BtFL, BtFC, BtFR, FL, FLc, FC, FRc, FR, SiR, BR, BC, BL und SiL des Upmixsignals aus den Kanälen FL', FR', BL' und BR' des Downmixsignals . Dabei werden zuerst vier Korrelationsvergleiche
K(FL' , FR' ) FC, (FL' ' , FR' '
K (FR' , BR' ) SiR, (FR' ' , BR' '
K (BR' , BL' ) BC, (BR' ' , BL' '
K (BL' , FL' ) SiL, (BL' ' , FL' ' durchgeführt, die die zentralen Kanäle FC, SiL, SiR, BC ergeben. Die Eckkanäle FL'', FR'', BR' ' und BL' ' könnten auf der Basis der individuellen Signalanteile aus dem Korrelationsvergleichen bestimmt werden. Diese zentralen Kanäle (als auch die aus diesen Korrelationsvergleichen resultierenden Eckkanäle FL' ' , FR' ' , BR' ' , BL' ' oder die wiederum aus diesen Kanälen resultierenden Eckkanäle FL, FR, BR, BL) könnten in einem Ausführungsbeispiel durch ein mit dem Downmixsignal mit übertragenes mittleres Residual korrigiert werden. Die Eckkanäle FL, FR, BR, BL ergeben sich durch Korrektur der entsprechenden Kanäle des Downmixsignals mit den beiden benachbarten zentralen Kanälen d.h. für FL' wird mit FC und SiL korrigiert, usw.. Alternativ könnten diese Eckkanäle FL, FR, BR, BL auch direkt aus den Korrelationsvergleichen als die entsprechenden individuellen Signale bestimmt werden (indem etwa ein einem solchen Korrelationsvergleich entstammender Eckkanal FL'', FR'', BR' ' , BL' ' um jenem benachbarten zentralen Kanal, der nicht diesem Korrelationsvergleich entstammt, korrigiert wird) . Die inverse Kodierung des Kanals FL mit verschiedenen Parametersets P(BtFL) und P(FLc) ergibt:
BtFL=0.7071*Inv (FL, P (BtFL) ) und
FLc=0.7071*Inv(FL,P (FLc) ) ,
Die inverse Kodierung des Kanals FR mit verschiedenen Parametersets P (BtFR) und P(FRc) ergibt:
BtFR=0.7071 * Inv ( FR, P (BtFR) ) und
FRc=0.7071* Inv (FR, P (FRc) ) .
Die inverse Kodierung des Kanals FC mit dem Parameterset P(BtFC) ergibt:
BtFC=0.7071*Inv(FC,P (BtFC!
Wie zu sehen ist, wird die Ausgabe der inversen Kodierung noch mit einem Faktor multipliziert, der hier als 0.7071 (-3dB) gewählt ist, aber auch anders gewählt werden kann. Somit lassen sich die 13 Kanäle des Upmixsignals auf der Basis von BtFL, BtFC, BtFR, FL' oder FL' ' , FLc, FC, FRc, FR' oder FR' ' , SiR, BR' oder BR' ' , BC, BL' oder BL' ' sowie SiL aus den vier Kanälen des Downmixsignals bestimmen. Wenn das Downmixsignal als Untermenge FL und FR enthält, so lassen sich wie beschrieben daraus FC, BtFL, FLc, BtFC, FRc, BtFR oder Teilmengen daraus bestimmen, wenn diese Kanäle im Downmix auf FL und FR aufgemischt wurden. In einem zweiten Ausführungsbeispiel wird ein Multikanalsignal mit k=9 Kanälen in einer Downmixvorrichtung in ein
Downmixsignal mit m=4 Kanälen downgemixt und darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in ein Upmixsignal mit n=9 Kanälen upgemixt. Dabei können das Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen.
Fig. 8 zeigt den Downmix der Kanäle TpFL, TpFC, TpFR, TpSiR, TpBR, TpBC, TPBL, TpSiL und TpC des Multikanalsignals. Die vier Kanäle des Downmixsignals werden wie folgt bestimmt:
TpFL x=TpFL+0.5* (TpC+TpSiL+TpFC)
TpFRx=TpFR+0.5* (TpC+TpSiR+TpFC)
TpBL x=TpBL+0.5* (TpC+TpSiL+TpBC)
TpBRx=TpBR+0.5* (TpC+TpSiR+TpBC) .
Das heisst, dass ein oberer vorderer linker Downmixkanal TpFL' aus einer Linearkombination der Kanäle TpFL, TpFC, TpC und TpSiL gebildet wird, ein oberer vorderer rechter Downmixkanal TpFR' aus einer Linearkombination der Kanäle TpFR, TpFC, TpC und TpSiR gebildet wird, ein oberer hinterer rechter Downmixkanal TpBR' aus einer Linearkombination der Kanäle TpBR, TpBC, TpC und TpSiR gebildet wird und ein oberer hinterer linker Downmixkanal TpBL' aus einer Linearkombination der Kanäle TpBL, TpBC, TpC und TpSiL gebildet wird. Die vier Kanäle des Downmix können weiter durch eine Stereomaskierung in der Datenmenge reduziert werden, beispielsweise durch eine USAC v2 Enkodierung, und ergeben somit zwei sogenannte Channel Pair Elements (CPEs) .
Fig. 9 zeigt den Upmix der Kanäle TpFL, TpFC, TpFR, TpSiR, TpBR, TpBC, TpBL, TpSiL und TpC des Upmixsignals aus den Kanälen TpFL', TpFR', TpBL' und TpBR' des Downmixsignals. Dabei werden zuerst vier Korrelationsvergleiche
K (TpFL' , TpFR') -> TpFC, (TpFL'', TpFR'') K ( TpFR' , TpBR') -> TpSiR, (TpFR'', TpBR' K ( TpBR' , TpBL') -> TpBC, (TpBR'', TpBL'') K (TpBL' , TpFL') -> TpSiL, (TpBL'', TpFL'') durchgeführt, die die zentralen Kanäle TpFC, TpSiL, TpSiR, TpBC ergeben. Diese zentralen Kanäle (als auch die aus diesen Korrelationsvergleichen resultierenden Eckkanäle TpFL' ' , TpFR' ' , TpBR' ' , TpBL' ' oder die wiederum aus diesen Kanälen resultierenden Eckkanäle TpFL, TpFR, TpBR, TpBL) könnten in einem Ausführungsbeispiel durch ein mit dem Downmixsignal mit übertragenes mittleres Residual korrigiert werden. Die Eckkanäle TpFL, TpFR, TpBR, TpBL ergeben sich durch Korrektur der entsprechenden Kanäle des Downmixsignals TpFL' , TpFR' , TpBR' , TpBL' mit den beiden benachbarten zentralen Kanälen, d.h. für TpFL' wird mit TpFC und TpSiL korrigiert, usw. Alternativ könnten diese Eckkanäle TpFL, TpFR, TpBR, TpBL auch direkt aus den Korrelationsvergleichen als die entsprechenden individuellen Signale bestimmt werden (indem etwa ein einem solchen Korrelationsvergleich entstammender Eckkanal TpFL' ' , TpFR'', TpBR'', TpBL'' um jenem benachbarten zentralen Kanal, der nicht diesem Korrelationsvergleich entstammt, korrigiert wird) . Der TpC wird auf der Basis der Summe aus TpSiL und TpSiR, z.B. durch Multiplikation mit einem Gewichtungsfaktor erhalten. Zum Beispiel kann durch TpC=0.7852*0.5 (TpSiL+TpSiR) dieser bestimmt werden.
In einem dritten Ausführungsbeispiel wird ein Multikanalsignal mit k=22 Kanälen (NHK-22. O-Anordnung) in einer
Downmixvorrichtung in ein Downmixsignal mit m=8 Kanälen downgemixt und darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in ein Upmixsignal mit n=22 Kanälen upgemixt. Dabei können das Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen. Dies wird durch eine Kombination des ersten und des zweiten Ausführungsbeispiels erreicht.
In einem zehnten Ausführungsbeispiel wird ein Multikanalsignal mit k=5 Kanälen in einer Downmixvorrichtung in ein Downmixsignal mit m=4 Kanälen downgemixt und darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in ein Upmixsignal mit n=5 Kanälen upgemixt. Dabei können das Multikanalsignal , das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen. Das Multikanalsignal weist die Kanäle FR, FC, FL, BL und BR auf.
Fig. 16 zeigt den Downmix des zehnten Ausführungsbeispiels. Hierzu wird der Kanal FC des Multikanalsignals zu gleichen Anteilen (vorzugsweise gewichtet mit 0.5) auf FR und FL aufgemischt, um die Kanäle FR x=FR+0.5* FC und FL x=FL+0.5*FC zu erhalten. Somit weist das Downmixsignal die Kanäle FR λ , FL λ , BR und BL auf. Fig. 17 zeigt den Upmix der Kanäle FL, FC und FR des Upmixsignals aus FL' und FR' des Downmixsignals . Dabei wird ein Korrelationsvergleich
K(FL', FR') -> FC, (FL, FR) durchgeführt. Die Kanäle FR und FL des Upmixsignals könnten auch auf der Basis von FR λ korrigiert mit FC und FL λ korrigiert mit FC bestimmt werden. Somit wird ein Upmixsignal mit den Kanälen FR, FC, FL, BR und BL erhalten. Vorzugsweise werden Kanalpaare BR-BL und/oder FRX-FLX des Downmixsignals einer Stereomaskierung unterzogen, beispielsweise einer USAC v2 Enkodierung, und ergeben somit zwei sogenannte Channel Pair Elements (CPEs) .
In einem vierten Ausführungsbeispiel wird ein Multikanalsignal mit k=14 Kanälen in einer Downmixvorrichtung in ein Downmixsignal mit m=8 Kanälen downgemixt und darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in ein Upmixsignal mit n=14 Kanälen upgemixt. Dabei kann das Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen. Das Multikanalsignal weist die Kanäle FR, FC, FL, BL, BR, TpFL, TpFC, TpFR, TpSiR, TpBR, TpBC, TpBL, TpSiL und TpC auf. Die Kanäle TpFL, TpFC, TpFR, TpSiR, TpBR, TpBC, TpBL, TpSiL und TpC werden, wie in dem zweiten Ausführungsbeispiel und in Fig. 8 dargestellt, in die Downmixsignale TpFL', TpFR', TpBL' und TpBR' heruntergemischt. Aus den Kanälen TpFL' , TpFR' , TpBL' und TpBR' des Downmixsignals werden wie in dem zweiten Ausführungsbeispiel und in Fig. 9 dargestellt die Kanäle TpFL, TpFC, TpFR, TpSiR, TpBR, TpBC, TpBL, TpSiL und TpC des Upmixsignals bestimmt. Die Kanäle FR, FC, FL, BL und BR werden wie in dem zehnten Ausführungsbeispiel und in Fig. 16 dargestellt in die Downmixsignale FR λ , FL λ , BL und BR heruntergemischt. Aus den Kanälen FR λ , FL λ , BL und BR des Downmixsignals werden, wie in dem zehnten Ausführungsbeispiel und in Fig. 17 dargestellt, die Kanäle FR, FC, FL, BL und BR des Upmixsignals bestimmt.
In einem fünften Ausführungsbeispiel wird ein Multikanalsignal mit k=22 Kanälen (NHK-22. O-Anordnung) in einer
Downmixvorrichtung in ein Downmixsignal mit m=6 Kanälen
downgemixt und darauffolgend in einer Upmix- oder
Kodiervorrichtung wieder in ein Upmixsignal mit n=22 Kanälen upgemixt. Dabei können das Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen.
Fig. 10 zeigt den Downmix der Kanäle TpC, TpBC, BtFL, BtFC, BtFR, FL, FLc, FC, FRc, FR, SiR, BR, BC, BL und SiL des
Multikanalsignals . Die vier Kanäle des Downmixsignals werden wie folgt bestimmt:
FL x=FL+0.7071*FLc+0.7071*BtFL+0.5* ( 0.7071 *BtFC+FC) +0.5* SiL FRx=FR+0.7071*FRc+0.7071*BtFR+0.5* ( 0.7071 *BtFC+FC) +0.5* SiR
BRx=BR+0.5* (SiR+0.7071* ( (TpC*0.5* TpBC) +BC) ) BL X=BL+ 0.5* (SiL+0.7071* ( (TpC*0.5* TpBC) +BC) ) .
Das heisst, dass der vordere linke Downmixkanal FL' und der vordere rechte Downmixkanal FR' wie im ersten Ausführungsbeispiel in Fig. 6 bestimmt werden. Der hintere linke Downmixkanal BL' und der hintere rechte Downmixkanal BR' werden wie im ersten Ausführungsbeispiel in Fig. 6 bestimmt mit dem Unterschied, dass zusätzlich Signalanteile von TpBC und TpC in BR λ und BL λ enthalten sind.
Fig. 11 zeigt den Upmix der Kanäle TpC, TpBC, BtFL, BtFC, BtFR, FL, FLc, FC, FRc, FR, SiR, BR, BC, BL und SiL des Upmixsignals aus den Kanälen FL' , FR' , BL' und BR' des Downmixsignals . Die Kanäle BtFL, BtFC, BtFR, FL, FLc, FC, FRc, FR, SiR, BR, BC, BL und SiL des Upmixsignals werden wie in dem ersten Ausführungsbeispiel in Fig. 7 aus den vier Kanälen des Downmixsignals bestimmt. Zusätzlich wird nun die inverse Kodierung des Kanals BC mit dem Parameterset P(TpBC) durchgeführt:
TpBC=0.7071*Inv(BC,P (TpBC) ) .
Der TpC wird aus einer Verstärkung des Kanals BC bestimmt. Die Verstärkung wird vorzugsweise mit einem Verstärkungsfaktor grösser eins, noch besser grösser zwei, insbesondere mit TpC=2.2646*BC bestimmt. Somit lassen sich die 15 Kanäle des Upmixsignals auf der Basis von TpC, TpBC, BtFL, BtFC, BtFR, FL' bzw. FL'', siehe oben, FLc, FC, FRc, FR' bzw. FR'', SiR, BR' bzw. BR' ' , BC, BL' bzw. BL' ' und SiL aus den vier Kanälen des Downmixsignals bestimmen. Wenn das Downmixsignal als Untermenge FL und FR enthält, so lässt sich wie beschrieben daraus FC, BtFL, FLc, BtFC, FRc, BtFR oder Teilmengen daraus bestimmen, wenn diese Kanäle im Downmix auf FL und FR aufgemischt wurden.
In einem sechsten Ausführungsbeispiel wird ein
Multikanalsignal mit k=7 Kanälen in einer Downmixvorrichtung in ein Downmixsignal mit m=2 Kanälen downgemixt und
darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in ein Upmixsignal mit n=7 Kanälen upgemixt. Dabei kann das
Multikanalsignal , das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen. Fig. 12 zeigt den Downmix der Kanäle TpFL, TpFC, TpFR, TpSiR, TpBR, TpBL und TpSiL des Multikanalsignals. Die zwei Kanäle des Downmixsignals werden wie folgt bestimmt:
TpFL x=TpFL+0.5*TpFC+TpSiL+0.7071*TpBL TpFRx=TpFR+0.5*TpFC+TpSiR+0.7071*TpBR.
Das heisst, dass ein oberer vorderer linker Downmixkanal TpFL' aus einer Linearkombination der Kanäle TpFL, TpFC, TpBL und TpSiL gebildet wird, und ein oberer vorderer rechter Downmixkanal TpFR' aus einer Linearkombination der Kanäle TpFR, TpFC, TpBR und TpSiR gebildet wird. Die zwei Kanäle des Downmix können weiter durch eine Stereomaskierung in der Datenmenge reduziert werden, beispielsweise durch eine USAC v2 Enkodierung, und ergeben somit ein sogenanntes Channel Pair Element (CPE) .
Fig. 13 zeigt den Upmix der Kanäle TpFL, TpFC, TpFR, TpSiR, TpBR, TpBL und TpSiL des Upmixsignals aus den Kanälen TpFL' und TpFR' des Downmixsignals. Dabei wird zuerst ein Korrelationsvergleich
K (TpFL' , TpFR') -> TpFC, (TpFL, TpFR) durchgeführt, der den zentralen Kanal TpFC sowie die Eckkanäle TpFR und TpFL ergibt. Die Kanäle TpFR und TpFL des Upmixsignals könnten alternativ auch auf der Basis von TpFRx korrigiert mit TpFC und TpFL λ korrigiert mit TpFC bestimmt werden. Somit wird eine erste Untermenge des Upmixsignals mit den Kanälen TpFR, TpFC, TpFL erhalten. Die inverse Kodierung des Kanals TpFL mit dem Parametersets P(TpSiL) ergibt:
TpSiL=In (TpFL, P (TpSiL) ) .
Danach wird die inverse Kodierung des Kanals TpSiL mit dem Parametersets P(TpBL) durchgeführt und ergibt:
TpBL=0.7071*In (TpSiL, P (TpBL) ) .
Die inverse Kodierung des Kanals TpFR mit dem Parametersets P (TpSiR) ergibt:
TpSiR=Inv (TpFR, P (TpSiR) ) .
Danach wird die inverse Kodierung des Kanals TpSiR mit dem Parametersets P(TpBR) durchgeführt und ergibt:
TpBR=0.7071*Inv (TpSiR, P (TpBR) )
Somit werden durch Korrelationsvergleich der Kanal TpFC sowie die Kanäle TpFL und TpFR des Upmixsignals und durch inverse Kodierung die Kanäle TpSiR, TpBR, TpBL und TpSiL erhalten. In einem siebten Ausführungsbeispiel wird ein Multikanalsignal mit k=22 Kanälen (NHK-22.2-Anordnung) in einer
Downmixvorrichtung in ein Downmixsignal mit m=6 Kanälen downgemixt und darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in ein Upmixsignal mit n=22 Kanälen upgemixt. Dabei können das Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen. Dies wird durch eine Kombination des fünften und des sechsten Ausführungsbeispiels erreicht. In einem achten Ausführungsbeispiel wird ein Multikanalsignal mit k=7 Kanälen in einer Downmixvorrichtung in ein Downmixsignal mit m=4 Kanälen downgemixt und darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in ein Upmixsignal mit n=7 Kanälen upgemixt. Dabei können das Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen.
Fig. 14 zeigt den Downmix der Kanäle FL, FC, FR, BR, BL, TpBC und TpC des Multikanalsignals. Die vier Kanäle des
Downmixsignals werden wie folgt bestimmt:
FL x=FL+0.5*FC
FRx=FR+0.5*FC
=BR+0.5* (TpC+0.3548*TpBC;
BL+0.5* (TpC+0.3548*TpBC)
Das heisst, dass ein vorderer linker Downmixkanal FL' aus einer Linearkombination der Kanäle FL und FC, ein vorderer rechter Downmixkanal FR' aus einer Linearkombination der Kanäle FR und FC gebildet wird, ein hinterer rechter Downmixkanal BR' aus einer Linearkombination der Kanäle BR, TpC und TpBC gebildet wird, und ein hinterer linker Downmixkanal BL' aus einer Linearkombination der Kanäle BL, TpC und TpBC gebildet wird. Die vier Kanäle des Downmixsignals können weiter durch eine Stereomaskierung von Kanalpaaren in der Datenmenge reduziert werden, beispielsweise einer USAC v2 Enkodierung, und ergeben somit zwei sogenannte Channel Pair Elements (CPEs) .
Fig. 15 zeigt den Upmix der Kanäle FL, FC,
und TpC des Upmixsignals aus den Kanälen FL' ,
des Downmixsignals. Dabei werden
Korrelationsvergleiche K(FL', FR') ~> FC, (FL, FR)
K(BL', BR' ) -> UpmixCenter, (BL, BR)
durchgeführt, die den zentralen Kanal FC sowie die Kanäle FL und FR bzw. den zentralen Kanal UpmixCenter sowie die Kanäle BR und BL ergeben, wobei der Kanal UpmixCenter nur ein Zwischensignal ist und keinen hinteren zentralen Kanal (BC) des Upmixsignals bildet. Die Kanäle FR und FL bzw. die Kanäle BR und BL des Upmixsignals könnten alternativ auch auf der Basis von FR λ korrigiert mit FC und FL λ korrigiert mit FC bzw. auch auf der Basis von BR λ korrigiert mit BC und BL λ korrigiert mit BC bestimmt werden. Somit wird eine erste Untermenge des Upmixsignals mit den Kanälen FR, FC, FL sowie mit den Kanälen BR, BC, BL erhalten.
Die Kanäle TpC und TpBC werden auf der Basis des Zwischensignals UpmixCenter bestimmt, z.B. durch TpC= 5.6234*UpmixCenter
TpBC=0.5*UpmixCenter .
Vorzugsweise wird der TpC durch eine Verstärkung des UpmixCenters grösser eins bzw. grösser zwei bzw. grösser drei bzw. grösser vier bzw. grösser fünf bestimmt und der TpBC durch eine Abschwächung mit einem Verstärkungsfaktor kleiner 1. Somit werden durch Korrelationsvergleich von FR λ und FL λ die Kanäle FR, FC und FL des Upmixsignals und durch Korrelationvergleich von BL λ und BR λ die Kanäle BR, BL, TpC und TpBC erhalten.
In einem neunten Ausführungsbeispiel wird ein Multikanalsignal mit k=14 Kanälen in einer Downmixvorrichtung in ein Downmixsignal mit m=6 Kanälen downgemixt und darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in ein Upmixsignal mit n=14 Kanälen upgemixt. Dabei können das Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen. Das Multikanalsignal weist die Kanäle FR, FC, FL, BL, BR, TpFL, TpFC, TpFR, TpSiR, TpBR, TpBC, TpBL, TpSiL und TpC auf. Die Kanäle TpFL, TpFC, TpFR, TpSiR, TpBR, TpBL und TpSiL werden, wie in dem sechsten Ausführungsbeispiel und in Fig. 12 dargestellt, in die zwei Downmixsignale TpFL' und TpFR' heruntergemischt. Aus den Kanälen TpFL' und TpFR' des Downmixsignals werden wie in dem sechsten Ausführungsbeispiel und in Fig. 13 dargestellt die Kanäle TpFL, TpFC, TpFR, TpSiR, TpBR, TpBL und TpSiL des Upmixsignals bestimmt. Die Kanäle FL, FC, FR, BR, BL, TpBC und TpC werden wie in dem achten Ausführungsbeispiel und in Fig. 14 dargestellt in die vier Downmixsignale FL', FR', BL λ und BR λ heruntergemischt. Aus den Kanälen FL', FR', BL λ und BR λ des Downmixsignals werden wie in dem achten Ausführungsbeispiel und in Fig. 15 dargestellt die Kanäle FL, FC, FR, BR, BL, TpBC und TpC des Upmixsignals bestimmt. In einem elften Ausführungsbeispiel wird ein Multikanalsignal mit k=6 Kanälen in einer Downmixvorrichtung in ein
Downmixsignal mit m=4 Kanälen downgemixt und darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in Upmixsignal mit n=6 Kanälen upgemixt. Dabei können das Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche
Kanäle aufweisen.
Fig. 18 zeigt den Downmix der Kanäle TpFL, TpFC, TpFR, TpBR, TpBL und TpC des Multikanalsignals. Die vier Kanäle des
Downmixsignals werden wie folgt bestimmt:
TpFL x=TpFL+0.5*TpFC
TpFRx=TpFR+0.5*TpFC
TpBL x=TpBL+0.5*TpC
TpBRx=TpBR+0.5*TpC. Das heisst, dass ein oberer vorderer linker Downmixkanal TpFL' aus einer Linearkombination der Kanäle TpFL und TpFC gebildet wird, ein oberer vorderer rechter Downmixkanal TpFR' aus einer Linearkombination der Kanäle TpFR und TpFC gebildet wird, ein oberer hinterer linker Downmixkanal TpBL' aus einer Linearkombination der Kanäle TpBL und TpC gebildet wird, und ein oberer hinterer rechter Downmixkanal TpBR' aus einer Linearkombination der Kanäle TpBR und TpC gebildet wird. Die vier Kanäle des Downmix können weiter durch eine Stereomaskierung in der Datenmenge reduziert werden, beispielsweise durch eine USAC v2 Enkodierung, und ergeben somit zwei sogenannte Channel Pair Elements (CPEs) . Fig. 19 zeigt den Upmix der Kanäle TpFL, TpFC, TpFR, TpBR, TpBL und TpC des Upmixsignals aus den Kanälen TpBL' , TpBR' , TpFL' und TpFR' des Downmixsignals . Dabei werden die zwei Korrelationsvergleiche K (TpFL' , TpFR') -> TpFC, (TpFL, TpFR)
K (TpBL' , TpBR') -> TpC, (TpBL, TpBR) durchgeführt, die den zentralen Kanal TpFC sowie die Kanäle TpFL und TpFR bzw. den zentralen Kanal UpmixCenter sowie die Kanäle TpBR und TpBL ergeben, wobei der Kanal UpmixCenter nur ein Zwischensignal ist und unmittelbar den TpC des Upmixsignals bildet. Die Kanäle TpFR und TpFL bzw. die Kanäle TpBR und TpBL des Upmixsignals könnten alternativ auch auf der Basis von TpFRx korrigiert mit TpFC und TpFL λ korrigiert mit TpFC bzw. auch auf der Basis von TpBR λ korrigiert mit TpBC und TpBL λ korrigiert mit TpBC bestimmt werden.
In einem zwölften Ausführungsbeispiel wird ein
Multikanalsignal mit k=ll Kanälen in einer Downmixvorrichtung in ein Downmixsignal mit m=8 Kanälen downgemixt und darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in Upmixsignal mit n=ll Kanälen upgemixt. Dabei können das
Multikanalsignal , das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen. Das zwölfte
Ausführungsbeispiel besteht aus einer Kombination des zehnten und elften Ausführungsbeispiels.
In einem dreizehnten Ausführungsbeispiel wird ein
Multikanalsignal mit k=8 Kanälen in einer Downmixvorrichtung in ein Downmixsignal mit m=4 Kanälen downgemixt und
darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in Upmixsignal mit n=8 Kanälen upgemixt. Dabei können das
Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen.
Fig. 20 zeigt den Downmix der Kanäle FL, FC, FR, BR, BL, TpBL, TpBR und TpC des Multikanalsignals . Die vier Kanäle des
Downmixsignals werden wie folgt bestimmt:
FL x=FL+0.5*FC
FRx=FR+0.5*FC
=BL+0.5*TpC+0.7071*TpBL
BR+0.5*TpC+0.7071*TpBR.
Das heisst, dass ein vorderer linker Downmixkanal FL' aus einer Linearkombination der Kanäle FL und FC gebildet wird, ein vorderer rechter Downmixkanal FR' aus einer Linearkombination der Kanäle FR und FC gebildet wird, ein hinterer linker Downmixkanal BL' aus einer Linearkombination der Kanäle BL, TpBL und TpC gebildet wird und ein hinterer rechter Downmixkanal BR' aus einer Linearkombination der Kanäle BR, TpBR und TpC gebildet wird. Die vier Kanäle des Downmixsignals können weiter durch eine Stereomaskierung in der Datenmenge reduziert werden, beispielsweise durch eine USAC v2 Enkodierung, und ergeben somit zwei sogenannte Channel Pair Elements (CPEs) .
Fig. 21 zeigt den Upmix der Kanäle FL, FC, FR, BR, BL, TpBR, TpBL und TpC des Upmixsignals aus den Kanälen BL' , BR' , FL' und FR' des Downmixsignals . Dabei werden zuerst die zwei Korrelations ergleiche
K(FL', FR') -> FC, (FL, FR)
K(BL', BR' ) -> UpmixCenter, (BL , BR) durchgeführt, die den zentralen Kanal FC sowie die Kanäle FL und FR bzw. den zentralen Kanal UpmixCenter sowie die Kanäle BR und BL ergeben, wobei der Kanal UpmixCenter nur ein Zwischensignal ist und keinen hinteren zentralen Kanal (BC) des Upmixsignals, sondern vielmehr den TpC des Upmixsignals bildet. Die Kanäle FR und FL bzw. die Kanäle BR und BL des Upmixsignals könnten alternativ auch auf der Basis von FR λ korrigiert mit FC und FL λ korrigiert mit FC bzw. auch auf der Basis von BR λ korrigiert mit UpmixCenter und BL λ korrigiert mit UpmixCenter bestimmt werden. Somit wird eine erste Untermenge des Upmixsignals mit den Kanälen FR, FC, FL sowie mit den Kanälen BR, BL und UpmixCenter erhalten. Die inverse Kodierung des Kanals BL mit dem Parametersets P(TpBL) ergibt:
TpBL=0.7071*Inv(BL,P (TpBL) ) . Die inverse Kodierung des Kanals BR mit dem Parametersets P(TpBR) ergibt:
TpBR=0.7071*Inv (BR, P (TpBR) ) Somit werden durch Korrelatio: svergleich die Kanäle FR, FC und FL des Upmixsignals und durch Korrelationvergleich von BL λ und BR λ die Kanäle BR, BL und TpC erhalten, und durch inverse Kodierung die Kanäle TpBL und TpBR erhalten.
In einem vierzehnten Ausführungsbeispiel wird ein
Multikanalsignal mit k=3 Kanälen in einer Downmixvorrichtung in ein Downmixsignal mit m=2 Kanälen downgemixt und
darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in Upmixsignal mit n=3 Kanälen upgemixt. Dabei können das
Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen.
Fig. 22 zeigt den Downmix der Kanäle TpFL, TpFC und TpFR des Multikanalsignals . Die zwei Kanäle des Downmixsignals werden wie folgt bestimmt:
TpFL x=TpFL+0.5*TpFC
TpFRx=TpFR+0.5*TpFC.
Das heisst, dass ein oberer vorderer linker Downmixkanal TpFL' aus einer Linearkombination der Kanäle TpFL und TpFC gebildet wird und ein oberer vorderer rechter Downmixkanal TpFR' aus einer Linearkombination der Kanäle TpFR und TpFC gebildet wird. Die zwei Kanäle des Downmixsignals können weiter durch eine Stereomaskierung in der Datenmenge reduziert werden, beispielsweise durch eine USAC v2 Enkodierung, und ergeben somit ein sogenanntes Channel Pair Element (CPE) .
Fig. 23 zeigt den Upmix der Kanäle TpFL, TpFC und TpFR des Upmixsignals aus den Kanälen TpFL' und TpFR' des Downmixsignals. Dazu wird der Korrelationsvergleich
K (TpFL' , TpFR') -> TpFC, (TpFL, TpFR) durchgeführt, der den zentralen Kanal TpFC sowie die Eckkanäle TpFR und TpFL ergibt. Die Kanäle TpFR und TpFL des Upmixsignals könnten alternativ auch auf der Basis von TpFRx korrigiert mit TpFC und TpFL λ korrigiert mit TpFC bestimmt werden.
In einem fünfzehnten Ausführungsbeispiel wird ein Multikanalsignal mit k=ll Kanälen in einer Downmixvorrichtung in ein Downmixsignal mit m=6 Kanälen downgemixt und darauffolgend in einer Upmix- oder Kodiervorrichtung wieder in Upmixsignal mit n=ll Kanälen upgemixt. Dabei können das Multikanalsignal, das Downmixsignal und das Upmixsignal evtl. noch zusätzliche Kanäle aufweisen. Das fünfzehnte Ausführungsbeispiel besteht aus einer Kombination des dreizehnten und vierzehnten Ausführungsbeispiels.
Sollte die durch die Ansprüche geschützte Erfindung Ausführungsbeispiele/Schutzbereiche der nachveröffentlichten WO2014/072513 aufweisen, so sei hiermit durch Referenz explizit offenbart, dass alle in WO2014/072513 offenbarten Ausführungsbeispiele, die unter den Schutzbereich der Ansprüche fallen, als Disclaimer offenbart sind. Das heisst, der durch die Patentansprüche gewährte Schutzbereich abzüglich der in WO2014/072513 offenbarten Ausführungsbeispiele (einzeln, alle zusammen oder in jeder Kombination) soll hiermit explizit offenbart sein.
Sollte die durch die Ansprüche geschützte Erfindung Ausführungsbeispiele/Schutzbereiche der unveröffentlichten CH01727/13 bzw. CH1696/13 aufweisen, so sei hiermit durch Referenz explizit offenbart, dass alle in CH01727/13 bzw. CH1696/13 offenbarten Ausführungsbeispiele, die unter den Schutzbereich der Ansprüche fallen, sowohl positiv als Ausführungsbeispiel als auch als Disclaimer offenbart sind. Das heisst, der durch die Patentansprüche gewährte Schutzbereich kann aufgeteilt werden in die in CH01727/13 bzw. CH1696/13 offenbarten Ausführungsbeispiele und in die/den durch den gewährten Schutzbereich abzüglich der in CH01727/13 bzw. CH1696/13 offenbarten Ausführungsbeispiele (einzeln, alle zusammen oder in jeder Kombination) verbleibenden Aus führungsbei spiele /verbleibenden Schutzbereich .
Sollte die durch die Ansprüche geschützte Erfindung Ausführungsbeispiele/Schutzbereiche der unveröffentlichten CH00743/14 aufweisen, so sei hiermit durch Referenz explizit offenbart, dass alle in CH00743/14 offenbarten
Ausführungsbeispiele, die unter den Schutzbereich der Ansprüche fallen, sowohl positiv als Ausführungsbeispiel als auch als Disclaimer offenbart sind. Das heisst, der durch die Patentansprüche gewährte Schutzbereich kann aufgeteilt werden in die in CH00743/14 offenbarte Ausführungsbeispiele und in die/den durch den gewährten Schutzbereich abzüglich der in CH00743/14 offenbarten Ausführungsbeispiele (einzeln, alle zusammen oder in jeder Kombination) verbleibenden Ausführungsbeispiele/verbleibenden Schutzbereich.
Sollte die durch die Ansprüche geschützte Erfindung Ausführungsbeispiele/Schutzbereiche der unveröffentlichten CH0369/14 aufweisen, so sei hiermit durch Referenz explizit offenbart, dass alle in CH0369/14 offenbarten
Ausführungsbeispiele, die unter den Schutzbereich der Ansprüche fallen, sowohl positiv als Ausführungsbeispiel als auch als Disclaimer offenbart sind. Das heisst, der durch die Patentansprüche gewährte Schutzbereich kann aufgeteilt werden in die in CH0369/14 offenbarte Ausführungsbeispiele und die/den durch den gewährten Schutzbereich abzüglich der in CH0369/14 offenbarten Ausführungsbeispiele (einzeln, alle zusammen oder in jeder Kombination) verbleibenden Aus führungsbei spiele /verbleibenden Schutzbereich .

Claims

PATENTA S PRÜCHE
1. Verfahren zum Upmixen eines Downmixsignals mit einem ersten Kanal und einem zweiten Kanal in ein Upmixsignal aufweisend die Schritte:
Durchführen eines Korrelationsvergleichs zur Bestimmung korrelierter Signalanteile des ersten Kanals und des zweiten Kanals des Downmixsignals, wobei ein erster Kanal des
Upmixsignals auf der Basis des ersten Kanals des
Downmixsignals, ein zweiter Kanal des Upmixsignals auf der Basis des zweiten Kanals des Downmixsignals und ein dritter Kanal des Upmixsignals auf der Basis der korrelierten
Signalanteile bestimmt wird, und
Bestimmen zumindest eines vierten Kanals des
Upmixsignals durch inverse Kodierung des ersten Kanals, des zweiten Kanals oder des dritten Kanals des Upmixsignals oder durch inverse Kodierung eines Signals, das auf den
korrelierten Signalanteilen, dem ersten Kanal des
Downmixsignals und/oder dem zweiten Kanal des Downmixsignals basiert .
2. Verfahren nach Anspruch 1, wobei der erste Kanal, der zweite Kanal und der dritte Kanal des Upmixsignals einer ersten Lautsprecherebene zugeordnet sind, und zumindest ein vierter Kanal des Upmixsignals, der einer zu der ersten
Lautsprecherebene benachbarten Lautsprecherebene zugeordnet ist, durch inverse Kodierung des ersten Kanals, des zweiten Kanals oder des dritten Kanals des Upmixsignals bestimmt wird.
3. Verfahren nach Anspruch 1 oder 2, wobei der erste Kanal des Upmixsignals ein vorderer linker Kanal, der zweite Kanal des Upmixsignals ein vorderer rechter Kanal und der dritte Kanal des Upmixsignals ein vorderer zentraler Kanal ist und der vierte Kanal ein unterer vorderer linker Kanal aus einer inversen Kodierung des vorderen linken Kanals des Upmixsignals ist, oder
ein unterer vorderer zentraler Kanal aus einer inversen Kodierung des vorderen zentralen Kanals des Upmixsignals ist, oder
ein unterer vorderer rechter Kanal aus einer inversen Kodierung des vorderen rechten Kanals des Upmixsignals ist.
4. Verfahren nach Anspruch 3, wobei der vierte Kanal
ein unterer vorderer linker Kanal aus einer inversen Kodierung des vorderen linken Kanals des Upmixsignals ist, ein unterer vorderer zentraler Kanal aus einer inversen Kodierung des vorderen zentralen Kanals des Upmixsignals gebildet wird, und
ein unterer vorderer rechter Kanal aus einer inversen Kodierung des vorderen rechten Kanals des Upmixsignals
gebildet wird.
5. Verfahren nach Anspruch 4, wobei ein vorderer zentral linker Kanal des Upmixsignals aus einer inversen Kodierung des vorderen linken Kanals des Upmixsignals gebildet wird und/oder ein vorderer zentral rechter Kanal des Upmixsignals aus einer inversen Kodierung des vorderen rechten Kanals des
Upmixsignals gebildet wird, wobei für die inverse Kodierung des vorderen linken Kanals des Upmixsignals für den vorderen zentral linken Kanal des Upmixsignals und für die inverse Kodierung des vorderen linken Kanals des Upmixsignals für den unteren vorderen linken Kanal des Upmixsignals getrennte
Parameter verwendet werden und/oder für die inverse Kodierung des vorderen rechten Kanals des Upmixsignals für den vorderen zentral rechten Kanal des Upmixsignals und für die inverse Kodierung des vorderen rechten Kanals des Upmixsignals für den unteren vorderen rechten Kanal des Upmixsignals getrennte Parameter verwendet werden.
6. Verfahren nach einem der Ansprüche 3 bis 5, wobei das Downmixsignal einen hinteren linken Kanal und einen hinteren rechten Kanal aufweist, und ein hinterer zentraler Kanal aus den mit einem Korrelationsvergleich ermittelten korrelierten Signalanteilen des hinteren linken Kanals und des hinteren rechten Kanal des Downmixsignals bestimmt wird.
7. Verfahren nach Anspruch 6, wobei ein seitlich linker Kanal des Upmixsignals auf der Basis der gemeinsamen
Signalanteile des ersten Kanals des Downmixsignals und des hinteren linken Kanals des Downmixsignals durch einen
Korrelationsvergleich bestimmt wird und/oder ein seitlich rechter Kanal des Upmixsignals auf der Basis der gemeinsamen Signalanteile des zweiten Kanals des Downmixsignals und des hinteren rechten Kanals des Downmixsignals durch einen
Korrelationsvergleich bestimmt wird.
8. Verfahren nach Anspruch 1 oder 2, wobei der erste Kanal des Upmixsignals ein hinterer linker Kanal, der zweite Kanal des Upmixsignals ein hinterer rechter Kanal und der dritte Kanal des Upmixsignals ein hinterer zentraler Kanal ist, und der vierte Kanal ein oberer hinterer zentraler Kanal, bestimmt aus einer inversen Kodierung des hinteren zentralen Kanals des Upmixsignals, ist.
9. Verfahren nach Anspruch 7 oder 8, wobei der obere zentrale Kanal auf der Basis des hinteren zentralen Kanals bestimmt wird, insbesondere durch Multiplikation mit einem Faktor grösser eins.
10. Verfahren nach Anspruch 1 oder 2, wobei der erste Kanal des Upmixsignals ein hinterer linker Kanal, der zweite Kanal des Upmixsignals ein hinterer rechter Kanal und der vierte Kanal ein oberer hinterer linker Kanal, bestimmt aus einer inversen Kodierung des hinteren linken Kanals des Upmixsignals oder des ersten Kanals des Downmixsignals, ist, und/oder
ein oberer hinterer rechter Kanal, bestimmt aus einer inversen Kodierung des hinteren rechten Kanals des
Upmixsignals oder des zweiten Kanals des Downmixsignals, ist.
11. Verfahren nach Anspruch 10, wobei der dritte Kanal des Upmixsignals ein oberer zentraler Kanal ist.
12. Verfahren nach einem der Ansprüche 1 bis 11, wobei das Downmixsignal einen oberen vorderen linken Kanal und einen oberen vorderen rechten Kanal aufweist, und ein oberer
vorderer zentraler Kanal des Upmixsignals auf der Basis der durch einen Korrelationsvergleich ermittelten korrelierten Signalanteile des oberen vorderen linken Kanals und des oberen vorderen rechten Kanals des Downmixsignals bestimmt wird, wobei ein oberer vorderer linker Kanal des Upmixsignals auf der Basis des oberen vorderen linken Kanals des Downmixsignals bestimmt wird und/oder ein oberer vorderer rechter Kanal des Upmixsignals auf der Basis des oberen vorderen rechten Kanals des Downmixsignals bestimmt wird.
13. Verfahren nach Anspruch 12, wobei ein oberer seitlich linker Kanal des Upmixsignals durch inverse Kodierung des oberen vorderen linken Kanals des Downmixsignals oder des Upmixsignals bestimmt wird und/oder ein oberer seitlich rechter Kanal des Upmixsignals durch inverse Kodierung des oberen vorderen rechten Kanals des Downmixsignals oder des Upmixsignals bestimmt wird.
14. Verfahren nach Anspruch 13, wobei ein oberer hinterer linker Kanal des Upmixsignals durch inverse Kodierung des oberen seitlich linken Kanals des Upmixsignals bestimmt wird und/oder ein oberer hinterer rechter Kanal des Upmixsignals durch inverse Kodierung des oberen seitlichen rechten Kanals des Upmixsignals bestimmt wird.
15. Verfahren nach Anspruch 1, wobei der erste Kanal des Upmixsignals ein vorderer rechter Kanal, der zweite Kanal des Upmixsignals ein vorderer linker Kanal, der dritte Kanal des Upmixsignals ein vorderer zentraler Kanal und der vierte Kanal ein vorderer zentral linker Kanal, bestimmt aus einer inversen Kodierung des vorderen linken Kanals des
Upmixsignals, ist, und/oder
ein vorderer zentral rechter Kanal, bestimmt aus einer inversen Kodierung des vorderen rechten Kanals des
Upmixsignals, ist.
16. Verfahren zum Upmixen eines Downmixsignals mit einen oberen vorderen linken Kanal und einen oberen vorderen rechten Kanal in ein Upmixsignal, wobei ein oberer vorderer zentraler Kanal des Upmixsignals auf der Basis der durch einen
Korrelationsvergleich ermittelten korrelierten Signalanteile des oberen vorderen linken Kanals und des oberen vorderen rechten Kanals des Downmixsignals bestimmt wird, wobei ein oberer vorderer linker Kanal des Upmixsignals auf der Basis des oberen vorderen linken Kanals des Downmixsignals bestimmt wird und ein oberer vorderer rechter Kanal des Upmixsignals auf der Basis des oberen vorderen rechten Kanals des
Downmixsignals bestimmt wird, wobei ein oberer seitlich linker Kanal oder ein oberer hinterer linker Kanal des Upmixsignals durch inverse Kodierung des oberen vorderen linken Kanals des Downmixsignals oder des Upmixsignals bestimmt wird und ein oberer seitlich rechter Kanal oder ein oberer hinterer rechter Kanal des Upmixsignals durch inverse Kodierung des oberen vorderen rechten Kanals des Downmixsignals oder des
Upmixsignals bestimmt wird.
17. Verfahren nach Anspruch 16, wobei ein oberer seitlich linker Kanal des Upmixsignals durch inverse Kodierung des oberen vorderen linken Kanals des Downmixsignals oder des Upmixsignals bestimmt wird und/oder ein oberer seitlich rechter Kanal des Upmixsignals durch inverse Kodierung des oberen vorderen rechten Kanals des Downmixsignals oder des Upmixsignals bestimmt wird.
18. Verfahren nach Anspruch 17, wobei ein oberer hinterer linker Kanal des Upmixsignals durch inverse Kodierung des oberen seitlich linken Kanals des Upmixsignals bestimmt wird und/oder ein oberer hinterer rechter Kanal des Upmixsignals durch inverse Kodierung des oberen seitlichen rechten Kanals des Upmixsignals bestimmt wird.
19. Verfahren zum Upmixen eines Downmixsignals mit einem oberen vorderen linken Kanal, einem oberen vorderen rechten Kanal, einem oberen hinteren linken Kanal und einem oberen hinteren rechten Kanal in ein Upmixsignal, aufweisend die Schritte;
Durchführen eines ersten Korrelationsvergleichs zur Bestimmung korrelierter Signalanteile des oberen vorderen rechten Kanals und des oberen hinteren rechten Kanals des Downmixsignals, wobei ein oberer vorderer rechter Kanal des Upmixsignals auf der Basis des oberen vorderen rechten Kanals des Downmixsignals, ein oberer hinterer rechter Kanal des Upmixsignals auf der Basis des oberen hinteren rechten Kanals des Downmixsignals und ein oberer seitlich rechter Kanal des Upmixsignals auf der Basis der korrelierten Signalanteile bestimmt wird;
Durchführen eines zweiten Korrelationsvergleichs zur Bestimmung korrelierter Signalanteile des oberen vorderen linken Kanals und des oberen hinteren linken Kanals des
Downmixsignals, wobei ein oberen vorderer linker Kanal des Upmixsignals auf der Basis des oberen vorderen linken Kanals des Downmixsignals, ein oberer hinterer linker Kanal des Upmixsignals auf der Basis des oberen hinteren linken Kanals des Downmixsignals und ein oberer seitlich linker Kanal des Upmixsignals auf der Basis der korrelierten Signalanteile bestimmt wird;
Bestimmen des oberen zentralen Kanals des Upmixsignals auf der Basis des oberen seitlich linken Kanals und des oberen seitlich rechten Kanals.
20. Verfahren nach Anspruch 19, wobei der obere zentrale
Kanal des Upmixsignals auf der Basis der Summe des oberen seitlich linken Kanals und des oberen seitlich rechten Kanals bestimmt wird.
21. Verfahren zum Upmixen eines Downmixsignals mit einen einem hinteren linken Kanal und einem hinteren rechten Kanal in ein Upmixsignal, aufweisend die Schritte;
Durchführen eines Korrelationsvergleichs zur Bestimmung korrelierter Signalanteile des hinteren linken Kanals und des hinteren rechten Kanals des Downmixsignals, wobei ein hinterer linker Kanal des Upmixsignals auf der Basis des hinteren linken Kanals des Downmixsignals und ein hinterer rechter Kanal des Upmixsignals auf der Basis des hinteren rechten Kanals des Downmixsignals bestimmt wird;
Bestimmen des oberen zentralen Kanals des Upmixsignals auf der Basis der korrelierten Signalanteile.
22. Verfahren nach Anspruch 21, wobei der hintere linken Kanal und der hintere rechte Kanal des Downmixsignals und des Upmixsignals einer mittleren oder einer oberen
Lautsprecherebene zugehört und/oder der obere zentrale Kanal ein oberer zentraler Kanal oder ein oberer hinterer zentraler Kanal ist.
23. Verfahren nach Anspruch 21 oder 22, wobei ein hinterer zentraler Kanal des Upmixsignals aus den korrelierten
Signalanteilen bestimmt wird und der obere zentrale Kanal des Upmixsignals aus dem hinteren zentralen Kanal des Upmixsignals bestimmt wird.
24. Verfahren nach Anspruch 23, wobei ein oberer hinterer zentraler Kanal des Upmixsignals aus dem hinteren zentralen Kanals bestimmt wird und der obere zentrale Kanal des
Upmixsignals aus dem oberen hinteren zentralen Kanal des
Upmixsignals oder dem hinteren zentralen Kanal des
Upmixsignals bestimmt wird.
25. Verfahren nach einem der Ansprüche 21 bis 24, wobei das Downmixsignal einen vorderen rechten Kanal und einen vorderen linken Kanal aufweist, wobei
ein vorderer rechter Kanal des Upmixsignals auf der Basis des vorderen rechten Kanals des Downmixsignals bestimmt wird,
ein vorderer linker Kanal des Upmixsignals auf der Basis des vorderen linken Kanals des Downmixsignals bestimmt wird, und
ein vorderer zentraler Kanal des Upmixsignals auf der Basis der durch einen Korrelationsvergleich bestimmten
korrelierten Anteile des vorderen linken Kanals und des vorderen rechten Kanals des Downmixsignals bestimmt wird.
26. Verfahren nach einem der Ansprüche 21 bis 25, wobei das Downmixsignal einen oberen vorderen rechten Kanal und einen oberen vorderen linken Kanal aufweist, wobei
ein oberer vorderer rechter Kanal des Upmixsignals auf der Basis des oberen vorderen rechten Kanals des
Downmixsignals bestimmt wird,
ein oberer vorderer linker Kanal des Upmixsignals auf der Basis des oberen vorderen linken Kanals des Downmixsignals bestimmt wird, und
ein oberer vorderer zentraler Kanal des Upmixsignals auf der Basis der durch einen Korrelationsvergleich bestimmten korrelierten Anteile des oberen vorderen linken Kanals und des oberen vorderen rechten Kanals des Downmixsignals bestimmt wird .
27. Computerprogram ausgebildet bei Ausführung auf einem Prozessor Schritte eines Verfahrens nach einem der Ansprüche 1 bis 26 auszuführen.
28. Vorrichtung zum Upmixen eines Downmixsignals mit einem ersten Kanal und einem zweiten Kanal in ein Upmixsignal aufweisend :
Korrelationsvergleichsvorrichtung zum Durchführen eines Korrelationsvergleichs zur Bestimmung korrelierter
Signalanteile des ersten Kanals und des zweiten Kanals des Downmixsignals, wobei ein erster Kanal des Upmixsignals auf der Basis des ersten Kanals des Downmixsignals, ein zweiter Kanal des Upmixsignals auf der Basis des zweiten Kanals des Downmixsignals und ein dritter Kanal des Upmixsignals auf der Basis der korrelierten Signalanteile bestimmt wird;
inverse Kodierungsvorrichtung zum Bestimmen zumindest eines vierten Kanals des Upmixsignals durch inverse Kodierung des ersten Kanals, des zweiten Kanals oder des dritten Kanals des Upmixsignals oder durch inverse Kodierung eines Signals, das auf den korrelierten Signalanteilen, dem ersten Kanal des Downmixsignals und/oder dem zweiten Kanal des Downmixsignals basiert .
29. Vorrichtung zum Upmixen eines Downmixsignals mit einem oberen vorderen linken Kanal und einem oberen vorderen rechten Kanal in ein Upmixsignal, aufweisend:
Korrelationsvergleichsvorrichtung zur Ermittlung eines oberen vorderen zentralen Kanals des Upmixsignals auf der Basis der durch einen Korrelationsvergleich ermittelten korrelierten Signalanteile des oberen vorderen linken Kanals und des oberen vorderen rechten Kanals des Downmixsignals bestimmt wird,
Vorrichtung zur Bestimmung eines oberen vorderen linken
Kanals des Upmixsignals auf der Basis des oberen vorderen linken Kanals des Downmixsignals und eines oberen vorderen rechten Kanals des Upmixsignals auf der Basis des oberen vorderen rechten Kanals des Downmixsignals,
inverse Kodierungsvorrichtung zur Bestimmung eines oberen seitlichen linken Kanals oder eines oberen hinteren linken Kanals des Upmixsignals durch inverse Kodierung des oberen vorderen linken Kanals des Downmixsignals oder des Upmixsignals und zur Bestimmung eines oberen seitlich rechten Kanals oder eines oberen hinteren rechten Kanals des
Upmixsignals durch inverse Kodierung des oberen vorderen rechten Kanals des Downmixsignals oder des Upmixsignals.
30. Vorrichtung zum Upmixen eines Downmixsignals mit einem oberen vorderen linken Kanal, einem oberen vorderen rechten Kanal, einem oberen hinteren linken Kanal und einem oberen hinteren rechten Kanal in ein Upmixsignal, aufweisend:
eine erste Korrelationsvergleichsvorrichtung zum Durchführen eines ersten Korrelationsvergleichs zur Bestimmung korrelierter Signalanteile des oberen vorderen rechten Kanals und des oberen hinteren rechten Kanals des Downmixsignals, eine erste Vorrichtung zur Bestimmung eines oberen vorderen rechten Kanals des Upmixsignals auf der Basis des oberen vorderen rechten Kanals des Downmixsignals, zur
Bestimmung eines oberen hinteren rechten Kanals des
Upmixsignals auf der Basis des oberen hinteren rechten Kanals des Downmixsignals und zur Bestimmung eines oberen seitlich rechten Kanals des Upmixsignals auf der Basis der korrelierten Signalanteile des oberen vorderen rechten Kanals und des oberen hinteren rechten Kanals des Downmixsignals; eine zweite Korrelationsvergleichsvorrichtung zum
Durchführen eines zweiten Korrelationsvergleichs zur
Bestimmung korrelierter Signalanteile des oberen vorderen linken Kanals und des oberen hinteren linken Kanals des
Downmixsignals,
eine zweite Vorrichtung zur Bestimmung eines oberen vorderen linken Kanals des Upmixsignals auf der Basis des oberen vorderen linken Kanals des Downmixsignals, zur
Bestimmung eines oberen hinteren linken Kanals des
Upmixsignals auf der Basis des oberen hinteren linken Kanals des Downmixsignals und zur Bestimmung eines oberen seitlich linken Kanals des Upmixsignals auf der Basis der korrelierten Signalanteile des oberen vorderen linken Kanals und des oberen hinteren linken Kanals des Downmixsignals;
eine dritte Vorrichtung zum Bestimmen des oberen zentralen Kanals des Upmixsignals auf der Basis des oberen seitlich linken Kanals und des oberen seitlich rechten Kanals.
31. Vorrichtung zum Upmixen eines Downmixsignals mit einen einem hinteren linken Kanal und einem hinteren rechten Kanal in ein Upmixsignal, aufweisend:
Korrelationsvergleichsvorrichtung zum Durchführen eines Korrelationsvergleichs zur Bestimmung korrelierter
Signalanteile des hinteren linken Kanals und des hinteren rechten Kanals des Downmixsignals,
eine erste Vorrichtung zur Bestimmung eines hinteren linken Kanals des Upmixsignals auf der Basis des hinteren linken Kanals des Downmixsignals und zur Bestimmung eines hinteren rechten Kanals des Upmixsignals auf der Basis des hinteren rechten Kanals des Downmixsignals;
eine zweite Vorrichtung zum Bestimmen des oberen zentralen Kanals des Upmixsignals auf der Basis der
korrelierten Signalanteile des hinteren linken Kanals und des hinteren rechten Kanals des Downmixsignals.
PCT/EP2014/071154 2013-10-02 2014-10-02 Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals WO2015049334A1 (de)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020167011324A KR20160072131A (ko) 2013-10-02 2014-10-02 다채널 신호의 다운믹스 및 다운믹스 신호의 업믹스 방법 및 장치
US15/026,739 US20160269847A1 (en) 2013-10-02 2014-10-02 Method and apparatus for downmixing a multichannel signal and for upmixing a downmix signal
KR1020167011299A KR20160072130A (ko) 2013-10-02 2014-10-02 2개 이상의 기본 신호로부터 다채널 신호의 유도
CN201480065847.6A CN106165453A (zh) 2013-10-02 2014-10-02 用于下混多通道信号和用于上混下混信号的方法和装置
AU2014331094A AU2014331094A1 (en) 2013-10-02 2014-10-02 Method and apparatus for downmixing a multichannel signal and for upmixing a downmix signal
JP2016520036A JP2016536855A (ja) 2013-10-02 2014-10-02 マルチチャンネル信号をダウンミックスし、ダウンミックス信号をアップミックスする方法及び装置

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
CH1696/13 2013-10-02
CH16962013 2013-10-02
CH01727/13 2013-10-09
CH01727/13A CH708710A1 (de) 2013-10-09 2013-10-09 Ableitung von Multikanalsignalen aus zwei oder mehreren Grundsignalen.
CH3692014 2014-02-28
CH0369/14 2014-02-28
CH0743/14 2014-05-15
CH7432014 2014-05-15
CH9952014 2014-07-01
CH0995/14 2014-07-01

Publications (1)

Publication Number Publication Date
WO2015049334A1 true WO2015049334A1 (de) 2015-04-09

Family

ID=51655760

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2014/071154 WO2015049334A1 (de) 2013-10-02 2014-10-02 Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals

Country Status (6)

Country Link
US (1) US20160269847A1 (de)
JP (1) JP2016536855A (de)
KR (2) KR20160072130A (de)
CN (1) CN106165453A (de)
AU (1) AU2014331094A1 (de)
WO (1) WO2015049334A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015173422A1 (de) * 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
EP3937515A1 (de) 2020-07-06 2022-01-12 Clemens Par Invarianzgesteuerter elektroakustischer übertrager

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015049332A1 (de) * 2013-10-02 2015-04-09 Stormingswiss Gmbh Ableitung von multikanalsignalen aus zwei oder mehreren grundsignalen
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
KR101993585B1 (ko) 2017-09-06 2019-06-28 주식회사 에스큐그리고 실시간 음원 분리 장치 및 음향기기
CN108156575B (zh) * 2017-12-26 2019-09-27 广州酷狗计算机科技有限公司 音频信号的处理方法、装置及终端
CN109286888B (zh) * 2018-10-29 2021-01-29 中国传媒大学 一种音视频在线检测与虚拟声像生成方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0608937A1 (de) * 1993-01-27 1994-08-03 Koninklijke Philips Electronics N.V. Tonsignalverarbeitungsanordnung zur Ableitung eines Mittelkanalsignals und audiovisuelles wiedergabesystem mit solcher Verarbeitungsanordnung

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9211756D0 (en) * 1992-06-03 1992-07-15 Gerzon Michael A Stereophonic directional dispersion method
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
US7929708B2 (en) * 2004-01-12 2011-04-19 Dts, Inc. Audio spatial environment engine
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
DE602005019484D1 (de) * 2005-12-20 2010-04-01 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Synthetisieren von drei Ausgangskanälen unter Verwendung von zwei Eingangskanälen
WO2009049896A1 (en) * 2007-10-17 2009-04-23 Fraunhofer-Fesellschaft Zur Förderung Der Angewandten Forschung E.V. Audio coding using upmix
EP2124486A1 (de) * 2008-05-13 2009-11-25 Clemens Par Winkelabhängig operierende Vorrichtung oder Methodik zur Gewinnung eines pseudostereophonen Audiosignals
KR101437896B1 (ko) * 2010-04-09 2014-09-16 돌비 인터네셔널 에이비 Mdct-기반의 복소수 예측 스테레오 코딩
US20120093323A1 (en) * 2010-10-14 2012-04-19 Samsung Electronics Co., Ltd. Audio system and method of down mixing audio signals using the same
US9154896B2 (en) * 2010-12-22 2015-10-06 Genaudio, Inc. Audio spatialization and environment simulation
US9031268B2 (en) * 2011-05-09 2015-05-12 Dts, Inc. Room characterization and correction for multi-channel audio
EP2645749B1 (de) * 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audiovorrichtung und Verfahren zur Umwandlung eines Audiosignals davon
US9761229B2 (en) * 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0608937A1 (de) * 1993-01-27 1994-08-03 Koninklijke Philips Electronics N.V. Tonsignalverarbeitungsanordnung zur Ableitung eines Mittelkanalsignals und audiovisuelles wiedergabesystem mit solcher Verarbeitungsanordnung

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
"Priority Document CH2300/12", 15 May 2014 (2014-05-15), pages 1 - 71, XP055155117, Retrieved from the Internet <URL:http://patentscope.wipo.int/search/docservicepdf_pct/id00000024970525.pdf?download> [retrieved on 20141126] *
ANONYMOUS: "Excerpt from Pyramix Digital Audio Workstation - User Manual", 25 July 2013 (2013-07-25), pages 335 - 343, XP055155807, Retrieved from the Internet <URL:http://www.merging.com/uploads/assets/Installers/Pyramix_8_1/Pyramix_v8.1_User_Manual.pdf> [retrieved on 20141128] *
CLEMENS PAR: "Poesie des Raums", FKT FERNSEH UND KINOTECHNIK, FACHVERLAG SCHIELE & SCHON GMBH., BERLIN, DE, vol. 67, no. 5, 1 May 2013 (2013-05-01), pages 260 - 264, XP001584335, ISSN: 1430-9947 *
CLEMENS PAR: "Two Undiscovered Treasures for Ground-breaking 3D Audio Coding Technology at Lowest Bitrates: Inverse Problems and Invariant Theory", 30 November 2012 (2012-11-30), pages 1 - 20, XP055155778, ISBN: 978-3-98-128303-7, Retrieved from the Internet <URL:http://www.swissaudec.com/pdf/recent_papers.pdf> [retrieved on 20141128] *
FALLER ET AL: "Multichannel Audio Processor which Adapts to 2-D and 3-D Loudspeaker Setups", JAES, AES, 60 EAST 42ND STREET, ROOM 2520 NEW YORK 10165-2520, USA, 26 October 2012 (2012-10-26), XP040574922 *
FALLER ET AL: "Multiple-Loudspeaker Playback of Stereo Signals", JAES, AES, 60 EAST 42ND STREET, ROOM 2520 NEW YORK 10165-2520, USA, vol. 54, no. 11, 1 November 2006 (2006-11-01), pages 1051 - 1064, XP040507974 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015173422A1 (de) * 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
EP3937515A1 (de) 2020-07-06 2022-01-12 Clemens Par Invarianzgesteuerter elektroakustischer übertrager
WO2022008092A1 (de) 2020-07-06 2022-01-13 Clemens Par Invarianzgesteuerter elektroakustischer übertrager

Also Published As

Publication number Publication date
KR20160072130A (ko) 2016-06-22
CN106165453A (zh) 2016-11-23
AU2014331094A1 (en) 2016-05-19
US20160269847A1 (en) 2016-09-15
KR20160072131A (ko) 2016-06-22
JP2016536855A (ja) 2016-11-24

Similar Documents

Publication Publication Date Title
WO2015049334A1 (de) Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals
DE102004005998B3 (de) Verfahren und Vorrichtung zur Separierung von Schallsignalen
DE102007018032B4 (de) Erzeugung dekorrelierter Signale
DE602005003342T2 (de) Methode zur Modellierung eines Mikrofons
DE2616762C2 (de) Einrichtung zur Aufweitung eines stereophonen Klangbildes
DE102018127071B3 (de) Audiosignalverarbeitung mit akustischer Echounterdrückung
DE102006050068A1 (de) Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
EP0905933A2 (de) Verfahren und Vorrichtung zum Mischen von Tonsignalen
DE112008003305T5 (de) Bandaufteilungs-Zeitausgleich-Signalverarbeitungs-Vorrichtung
DE4136022A1 (de) Vorrichtung zum ausweiten und steuern von schallfeldern
EP2939445B1 (de) Erzeugung von 3d-audiosignalen
WO2015049332A1 (de) Ableitung von multikanalsignalen aus zwei oder mehreren grundsignalen
DE102019135690B4 (de) Verfahren und Vorrichtung zur Audiosignalverarbeitung für binaurale Virtualisierung
EP2614660A1 (de) Vorrichtung und verfahren zur zeitlichen auswertung und optimierung von stereophonen oder pseudostereophonen signalen
DE102004053790A1 (de) Verfahren zur Erzeugung von Stereosignalen für getrennte Quellen und entsprechendes Akustiksystem
EP0808076B1 (de) Raumklangsystem
EP0776144B1 (de) Signalmodifikationsschaltung
DE3142157A1 (de) Signalverarbeitungsschaltung
EP1123638B1 (de) Vorrichtung und verfahren zur qualitätsbeurteilung von mehrkanaligen audiosignalen
WO2015128376A1 (de) Autonome residualbestimmung und gewinnung von residualarmen zusatzsignalen
DE102011108788B4 (de) Verfahren zur Verarbeitung eines Audiosignals, Audiowiedergabesystem und Verarbeitungseinheit zur Bearbeitung von Audiosignalen
WO2015128379A1 (de) Kodierung und dekodierung eines niederfrequenten kanals in einem audiomultikanalsignal
EP3275212B1 (de) Verfahren zur analyse und dekomposition von stereoaudiosignalen
DE102019124285A1 (de) Dekorrelation von eingangssignalen
WO2015173422A1 (de) Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2016520036

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 20167011324

Country of ref document: KR

Kind code of ref document: A

REEP Request for entry into the european phase

Ref document number: 2014777666

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2014777666

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2016117289

Country of ref document: RU

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2014331094

Country of ref document: AU

Date of ref document: 20141002

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 15026739

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14777666

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 14777666

Country of ref document: EP

Kind code of ref document: A1