CN1452851A - 保持三维中的空间谐波的多通道环绕声母版制作和再现技术 - Google Patents

保持三维中的空间谐波的多通道环绕声母版制作和再现技术 Download PDF

Info

Publication number
CN1452851A
CN1452851A CN 00819561 CN00819561A CN1452851A CN 1452851 A CN1452851 A CN 1452851A CN 00819561 CN00819561 CN 00819561 CN 00819561 A CN00819561 A CN 00819561A CN 1452851 A CN1452851 A CN 1452851A
Authority
CN
China
Prior art keywords
sound field
sound
loud speaker
signal
harmonic wave
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 00819561
Other languages
English (en)
Inventor
詹姆斯·A·摩尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sonic Solutions LLC
Original Assignee
Sonic Solutions LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/552,378 external-priority patent/US6904152B1/en
Application filed by Sonic Solutions LLC filed Critical Sonic Solutions LLC
Publication of CN1452851A publication Critical patent/CN1452851A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

记录和传输源自多个非立体声或定向声音信号的声场的技术,其通过多个分离扬声器再现具有基本上精确匹配原始声场那些谐波的空间谐波的声场。在母版制作过程定位非立体声声源以使用所有扬声器的贡献,以便保持空间谐波。如果特殊的扬声器布局不同于在母版制作过程中假设的,扬声器信号在家庭,电影院或其他声音再现场所重新矩阵变换,使得通过不同扬声器布局再现的声场的空间谐波匹配原始声场的那些谐波。一种可选的方案包括记录或传输定向麦克风信号,或它们的空间谐波分量,然后在声音再现场所以考虑特殊扬声器布局的方式将这些信号矩阵变换。该技术对二维声场和更一般的三维情况而描述,后者基于使用球谐波。

Description

保持三维中的空间谐波的多通道 环绕声母版制作和再现技术
相关申请的相互参照
本申请是于1997年9月24日申请的申请系列号08/936,636的继续申请,其特此在此引入作为参考。
技术领域
本发明一般地涉及电子声传输,录音和再现技术,更特别地,涉及环绕声技术中的改进。
背景技术
在过去几十年中,已经不断取得声音再现品质和真实感的改进。与早期的非立体声(单通道)声音再现比较,通过空间分开的扬声器的立体声(双通道)录音和重放显著地提高再现声的真实感。新近,音频信号已经在双通道中以驱动环绕听者放置的四个或更多扬声器的方式来编码。这种环绕声进一步增加了再现声音的真实感。多通道(三个或更多通道)录音用于大多数电影的声轨,这在合适地配备包括绕墙放置以环绕听众的扬声器的声***的电影院中,提供一些引人入胜的音频效果。当前出现小的光学CD(光盘)上的多通道音频录制标准,这种小光盘预期对家用变得非常流行。最近的DVD(数字化视频光盘)标准规定在可以或不可以包含视频的CD上的多通道PCM(脉冲码调制)音频。
理论上,音频波阵面的最精确再现通过将声全息图记录并重放来获得。但是,将不得不记录几万,甚至数百万独立的通道。二维阵列的扬声器将不得不环绕家庭或电影院放置,具有不大于所希望再现的最高频率波长一半的间距,相隔稍微少于一厘米,以便精确地重建原始的音频波阵面。将不得不对这大量扬声器的每一个记录独立的通道,包括在录音过程中使用类似大量的麦克风。从而,这种音频波阵面的精确再现对用于家庭,电影院等的音频再现***一点也不实用。
当所希望的再现是三维的和扬声器不再共面时,这些复杂化相应地增加,并且这种再现变得更不切实际。向三维的延伸提供特殊效果,例如对于电影或在母版(mastering)制作音乐唱片中,以及对于当原始声源不局限于平面时。即使,比方说,平面舞台上音乐家录音情况下,由于乐器布局中的能够被记录并再现的反射和变化,合成的环绕声环境将具有三维特征。虽然量化比定位声源更难,但是包含第三维增加声场的这种空间感和深度感,即使实源定位于共面布局。
因此,本发明基本和一般目的是,通过多通道录音,例如在新兴的新音频标准中提供的,用与当前在环绕声***中使用的大约相同数目的扬声器,来提供具有改进真实感的再现声音技术。
本发明的另一目的是,提供一种方法和/或***,其用于在家庭,电影院,或其它收听场所重放记录的或传输的多通道声,允许使用者在收听场所为使用的扬声器的特定布局设置电子矩阵。
本发明的进一步目的是,将这些技术和方法延伸到扬声器置于非共面布局的三维声场的记录和再现。
发明内容
这些和另外的目的由本发明来实现,其中,简单地和一般地,音频场由多路信号通过环绕听音区域放置的四个或更多扬声器来获得并再现,信号以这样一种方式来处理,用环绕听音区域的几乎任何特定的扬声器布局来再现已获得音频场的基本上确切指定数目的空间谐波。这增加声音再现的真实感,而不对扬声器的位置强加任何特殊的限制。
任何存在的扬声器位置,都用作多通道声音信号电子编码和/或解码中的参数,以在特殊的再现布局中产生这种有利结果,而不是要求扬声器在***能够再现指定数目的空间谐波之前以某种特殊的模式布局。如果移动一个或多个扬声器,这些参数改变以保持再现声音中的空间谐波。五个通道和五个扬声器的使用在下面描述,以说明本发明的各个方面。
根据本发明的一个特殊方面,单个的非立体声通过使用矩阵混合在一起,当录音或形成声音传输时,该矩阵有角度地确定它们的位置,当通过环绕听者的假设的扬声器布局再现时,具有改进的真实感。可能涉及所有通道,以便再现具有所希望的空间谐波的声音,而不是象当前用标准展平技术所做的一样仅仅将给定的非立体声发送到驱动位于声音位置每侧扬声器的两个通道。一个实例应用是在几个音乐家一起演奏的唱片的母版制作中。每个乐器的声音首先分别记录,然后以某种方式混合,在再现时确定环绕听音区域的声音的位置。通过使用所有通道以保持空间谐波,再现的声场接近于音乐家演奏空间中存在的声场。
根据本发明的另一个特殊方面,多通道声音可以在家庭,电影院或再现的其它场所重新矩阵变换,以便适应不同的扬声器布局而不是最初母版制作时假设的。期望的空间谐波用不同的真实扬声器布局来精确地再现。这允许扬声器布局的自由,而不损失声音改进的真实感,在家庭中尤其重要,其经常对扬声器布局施加限制。
根据本发明的进一步特殊方面,声场最初通过使用定向麦克风用方向信息来获得。麦克风输出,或从麦克风输出的初始子矩阵产生的空间谐波信号,通过分离通道记录或传输到收听场所。然后,传输的信号在家庭或其它收听场所以考虑真实扬声器位置的方式来矩阵变换,以便再现记录的声场,其具有匹配录音场所空间谐波的一些空间谐波。
这些不同方面可以使用二维或三维中的空间谐波。在二维的情况,音频波阵面由基本上共面的扬声器布局来再现,或者初始录音基于二维空间谐波或通过将三维谐波投影到扬声器平面上。在三维再现中,一个或多个扬声器置于不同高度,而不是这种二维平面。类似地,三维声场由多个定向麦克风的非共面布局来获得。
本发明各个方面另外的目的,特征和优点将从下面它的优选实施方案的描述中变得显然,其中实施方案应该连同附图来理解。
附图说明
图1是环绕听音区域的多个扬声器布局的平面图。
图2A-D说明图1的声音再现布局的声音空间频率。
图3是用于定位非立体声声音位置的矩阵变换***的框图。
图4是框图,用于将在图3中矩阵变换的信号重新矩阵变换,以便考虑不同的扬声器位置而不是最初将信号矩阵变换时假设的。
图5和6框图,其显示用于获得和再现来自多个定向麦克风的声音的可选方案。
图7给出图5和6中麦克风矩阵块的更多细节。
图8显示作为图5和6***音频信号源的三个麦克风的布局。
图9说明球面坐标的布局。
图10显示四个麦克风的三维布置的角度对准。
具体实施方式
讨论以二维平面中的空间谐波方法开始。这一方法的一些结果是:(1)一种记录可以用来供给任何数目扬声器的环绕声的方法;(2)一种扫视非立体声声音以便精确地产生给定空间谐波组的方法;(3)一种在三个通道中存储和传输环绕声的方法,两个通道是标准立体声混音,并且通过第三个通道的使用,可以再现保持原始空间谐波的环绕声。
在二维的讨论之后,这一相同理论延伸到三维。在二维中,空间谐波基于单个变量,角度φ的傅立叶正弦和余弦级数。遗憾的是,3D形式的数学不如2D的清晰紧凑。没有任何特别好的方法来减少复杂度,并且因为这个原因首先给出2D形式。
为了将空间谐波方法延伸到三维,于是给出勒让德函数和球谐波的简短讨论。在某种意义上,这是傅立叶正弦和余弦级数的推广。傅立叶级数是一个角度φ的函数。级数是周期性的。它可以认为是一个周期上的函数表示。球谐波定义在球表面上,并且是两个角度θ和φ的函数。φ是方位角,定义0°为直前,90°为向左,180°为直接向后。θ是偏角(上和下),0°直接向上,90°为水平面,180°为直接向下。这些在图9中对点(θ,φ)显示。注意θ为0°~180°,而φ为0°~360°(或者,可选的-180°~180°)。
二维中的空间谐波
人11在图1中显示,位于被扬声器SP1,SP2,SP3,SP4和SP5环绕的听音区域的中间,使这些扬声器对准以将它们的声音导向中心。为了本申请描述的目的,建立角坐标***。听者11的前向,面对前扬声器SP1,作为基准被置于(θ1,φ1)=(90°,0°)。从那个参照,剩余的扬声器SP2(前左),SP3(后左),SP4(后右),和SP5(前右)的角坐标分别为(θ2,φ2),(θ3,φ3),(θ4,φ4),和(θ5,φ5)。这里,扬声器置于这样一个典型布局中,其定义基本上为平面的表面,一个实例是θ=90°的水平平面表面,其平行于扬声器放置房间的地板。在这种情况下,每个θ15于是都是90°,并且这些θ将暂时不明确表示,并且在图1中省略。一个或多个扬声器的高度高于一个或多个其它扬声器不是必需的,但是可能需要以便适应受限制的空间。一个或多个θi≠90°的情况在下面讨论。
非立体声声音13,例如来自单个乐器的声音,期望置于离那个零基准为φ0的角度,位于没有扬声器的位置。通常可能有其它非立体声声音,期望同时置于其他角度,但是为了说明简单,这里只显示源13。对于多乐器音乐源,例如在母版制作过程中,各个乐器的声音将置于环绕听音区域的不同角度φ0。每个乐器的声音典型地由一个或多个非立体声记录的麦克风在至少一个分离通道上获得。这些非立体声录音在母版制作过程中用作声源。作为选择,母版制作可以从分离的乐器麦克风实时地执行。
在描述母版制作过程之前,参考图2A-D来说明空间频率的概念。图2A根据角坐标显示环绕图1听音区域的空间。显示每个扬声器SP1,SP2,SP3,SP4和SP5的五个位置,以及声源13的期望位置。可以把声音13看作空间脉冲,而其又可以表示成傅立叶级数展开式,如下: f ( φ ) = a 0 + Σ m = 1 M ( a m cos mφ + b m sin mφ ) - - - - ( 1 )
其中m是各个空间谐波的整数,从0到数M的谐波被重建,am是每个谐波一个分量的系数,而bm是每个谐波正交分量的系数。这样,值a0表示空间函数零阶的值。
空间零阶在图2B中显示,具有环绕整个空间的相同幅度,随空间脉冲声源13的幅度上升和下降。图2C显示第一阶空间函数,当具有环绕空间的一个完整周期,在脉冲13的角度是最大值。第二阶空间函数,这在图2D中说明,具有环绕空间的两个完整周期。算术地,空间脉冲13由大量阶精确地表示,但是只使用几个扬声器的事实限制可能包括于再现声场中的空间谐波的数量。如果扬声器的数量等于或大于(1+2n),其中n在这里是期望再现的谐波数量,那么再现声场的0到n空间谐波可以基本上精确地再现,这些谐波与存在于原始声场的空间谐波一样。相反地,可以精确再现的空间谐波是0到n的谐波,其中n是最大全整数,其等于或小于环绕听音区域放置的扬声器数量减1的一半。作为选择,可以选择再现小于这一最大数目的可能空间谐波,如在特殊***中。
本发明的一个特殊方面由图3说明,其示意地显示用来母版制作多通道录音的调音台的某些函数。在这个实例中,五个信号S1,S2,S3,S4和S5在适当记录介质例如磁带的五个分离通道中记录,可能以数字形式。这些信号的每一个驱动各个扬声器。两个非立体声声源17和19被说明混合进记录信号S1-S5。源17和19可以是,例如,溶合在一起的不同乐器的现场或记录的信号。源17和19中的一个或两个也可以是合成产生的或自然记录的声音效果,语音等等。实际上,通常有远多于两个这样的信号用来录音。各个信号可以一次一个地加入记录磁道,或者混合在一起用于同时录音。
图3说明的是“定位”非立体声声音技术。简而言之,当录音通过环绕声***重放时,每个声源17和19的视在位置在母版制作过程中设置,这在上面关于图1描述。当前,母版制作台的通用扫视技术将非立体声声音导入记录信号S1-S5中仅仅两个,其供给声音期望位置两侧的扬声器,具有确定声源到听者视在位置的相对幅度。但是这缺乏一定真实感。因此,如在图3中所示,每个声源都供给五个通道的每一个,设置相对增益以构造一组信号,这组信号具有从那个位置发出的声场的一定数量空间谐波,至少零和第一谐波。一个或多个通道可能仍然接收不到特殊信号的任何部分,但是现在因为它是保持给定数量空间谐波的结果,而不是因为信号被人工地限制到仅仅两个通道。
源17信号到五个分离通道S1-S5的相对贡献由各个可变增益放大器21,22,23,24和25来表示。这些放大器的各个增益g1,g2,g3,g4和g5由电路27中来自控制处理器29的控制信号来设置。类似地,源19的声音信号通过各个放大器31,32,33,34和35导入每个通道S1-S5。放大器31-35的各个增益g1′,g2′,g3′,g4′和g5′也由控制处理器29通过电路37来设置。这些增益组由控制处理器29从录音师通过控制面板45的输入来计算。这些输入包括来自源17和19的声音期望放置的角度Φ(图1)和一组假设的扬声器放置角度φ15。计算的参数也可以通过电路47随意地提供以记录。放大器21-25各个独立输出通过各个求和结点39,40,41,42和43与放大器31-35的那些输出相结合,以提供五个通道信号S1-S5。这些信号S1-S5最后通过各个扬声器SP1-SP5来再现。
控制处理器29包括DSP(数字信号处理器),其运算以求解来自输入信息的联立方程,以计算每个非立体声声源的一组相对增益。求解每个分离放置声源位置的一组主要线性方程可以如下表示: 1 + 2 Σ m cos m ( φ 0 - φ i ) = Σ j = 1 N g i [ 1 + 2 Σ m cos m ( φ j - φ i ) ] - - - - ( 2 )
其中φ0表示声音期望视在位置的角度,φi和φj表示对应于各个通道扬声器位置的角坐标,每个i和j具有从1到通道数的整数值,m表示空间谐波,从0延伸到再现时与原始声场的那些谐波匹配的谐波数,N是通道的总数,gi表示各个通道的相对增益,i从1延伸到通道数。方程求解的就是这组相对增益。i和j下标的使用遵循矩阵的通常数学符号,其中i是矩阵术语的行号,j是列号。
在通道数N等于5,扬声器数也等于5,并且只有零和第一空间谐波精确再现的特殊实例中,上面的线性方程可以表示成下面的矩阵:
Figure A0081956100131
这个通用矩阵求解期望的一组相对增益g1-g5
这是秩为3的矩阵,意味着有大量相对增益值满足它。为了给出一组唯一的增益,加入其它限制。一个这种限制是第二空间谐波为0,这导致上面矩阵的底部两行改变,如下:
Figure A0081956100132
可以加于通用矩阵求解的可选限制是要求速度向量(对低于大约750-1500Hz过渡频率的频率)和功率向量(对高于这一过渡的频率)基本上对准。众所周知,人耳在高于和低于这一过渡的频率范围中用不同的机制来辨别声音的方向。因此,使得可能延伸到两个频率范围的声音的视在位置,对耳朵好像是来自相同的位置。这通过使每个这些向量的角方向的表达式相等来获得,如下: arctan Σ g i sin φ i Σ g i cos φ i ≡ arctan Σ g i 2 sin φ i Σg i 2 cos φ i - - - - ( 5 )
速度向量方向的定义在等号左边,功率向量方向的定义在右边。对于功率向量,取增益项的平方为人耳响应高频范围的方式模型的近似值,所以可以在个体之间稍作改变。
一旦由控制处理器29对环绕听者11放置的每个声音计算出一组相对增益,产生的信号S1-S5可以从录音15重放,并且单独地驱动扬声器SP1-SP5的一个。如果扬声器精确地置于环绕听者11的角坐标φ15,或非常接近于那些坐标,那些角坐标是当计算每个声源的相对增益时假设的,那么所有声源的位置对听者将好像精确地是录音师希望它们置于的位置。包括在这些计算中的零,第一和任何较高阶空间谐波将精确地再现。
但是,家庭,电影院或录音重放的其它场所的实际约束经常限制声音***扬声器可以放置的位置。如果环绕听音区域有角度地放置在不同于那些在录音过程中假设的角度上,各个声源的空间定位可能不是最佳的。因此,根据本发明的另一个方面,信号S1-S5由听者的声音***以图4中说明的方式重新矩阵变换。从录音15重放的声音通道S1-S5,在特殊的设备中,初始由谐波矩阵51转换成空间谐波信号a0(零谐波),a1和b1(第一谐波)。第一谐波信号a1和b1彼此正交。
如果保持多于零和第一空间谐波,对于每个增加的谐波,由矩阵51产生两个额外的正交信号。然后这些谐波信号用作扬声器矩阵53的输入,矩阵53将它们转换成一组修改的信号S1′,S2′,S3′,S4′和S5′,这些信号用来以提供再现声音改进真实感的方式驱动唯一位置的扬声器,这一再现声音是最初用假设的不同扬声器位置母版制作录音15时想要的。这由在矩阵51和53中通过各个增益控制电路55和57从控制处理器59设置的相对增益来实现。处理器59从已经用声轨记录并重放的母版制作参数来计算这些增益,主要是假设的扬声器角度φ1,φ2,φ3,φ4和φ5,以及由听者通过控制台61提供给控制处理器的相应真实扬声器角度β1,β2,β3,β4和β5
谐波矩阵51的算法通过使用分成五组每组三个的15个可变增益放大器来说明。三个放大器连接以接收从录音重放的每个声音信号S1-S5。放大器63,64和65接收S1信号,放大器67,68和69接收S2信号,等等。这五组中每组的一个放大器的输出与求和结点81连接,具有a0输出信号,这五组中每组的另一个放大器的输出与求和结点83连接,具有a1输出信号,并且每组的第三个放大器的输出连接到第三求和结点85,它的输出是b1信号。
矩阵51仅从录音15重放的音频信号S1-S5以及在母版制作过程中假设的扬声器角度φ1,φ2,φ3,φ4和φ5来计算中间信号a0,a1和b1,如下:
a0=S1+S2+S3+S4+S5
a1=S1cosφ1+S2cosφ2+S3cosφ3+S4cosφ4+S5cosφ5              (6)
b1=S1sinφ1+S2sinφ2+S3sinφ3+S4sinφ4+S5sinφ5
这样,在显示为矩阵51的这一算法的表示中,放大器63,67,70,73和76具有单位增益,放大器64,68,71,74和77具有小于1的增益,它是假设的扬声器角度的余弦函数,并且放大器65,69,72,75和78具有小于1的增益,它是假设的扬声器角度的正弦函数。
矩阵53取这些信号并且提供新的信号S1′,S2′,S3′,S4′和S5′以驱动具有环绕听音区域唯一位置的扬声器。在图4中显示的处理的表示,包括15个可变增益放大器87-103,以五个放大器87-91接收信号a0,五个放大器92-97接收信号a1,和五个放大器98-103接收信号b1来分组。这三组中每组的唯一一个放大器的输出提供到求和结点105的输入,这些组中每组的另一个的输出提供到求和结点107的输入,并且其它放大器以类似的方式将它们的输出连接到结点109,111和113,如图所示。
设置放大器87-103的相对增益以满足下面的联立方程组,其依赖于实际的扬声器角度β: Σ j = 1 N [ 1 + 2 cos ( β j - β i ) ] S j ′ = a 0 + a 1 cos β i + b 1 sin β i - - - - ( 7 )
其中在本实例中N=5,使得i和j具有值1,2,3,4和5。结果是家庭,电影院或其它使用者能够“拨入”由扬声器位置取的特殊角度,其有时甚至可以被改变,以保持母版制作技术提供的改进空间性能。
上面实际扬声器位置角度β的联立方程的矩阵表示如下,其中也加入第二空间谐波等于零的条件:
Figure A0081956100152
选择放大器87-103的相对增益值以实现产生的a0,a1和b1的系数,其由求解上面电路矩阵53的输出信号S1′-S5′的矩阵来产生,矩阵53具有给定的一组实际扬声器位置角度β15
前面的描述论述包括录音的母版制作和再现过程,这由在图3和4中的块15来表示。但是,这些过程也可以用于有实时传输的情况,母版制作的声音通过块15到一个或多个再现位置。
关于图3和4的描述主要涉及母版制作三维声场,或至少涉及来自各个非立体声声源的声场。参考图5,说明用于从表示三维中声场的信号母版制作录音或声音传输的技术。三个麦克风121,123和125是一种类型,并且关于声场放置,以产生包含声场信息的音频信号m1,m2和m3,声场信息允许声场在一组环绕声扬声器中再现。例如,将这些麦克风置于交响乐大厅,产生信号,声音效果可以从这些信号重建,具有真实的方向性。
如在127指出的,这三个信号可以通过三个通道的传输立刻记录或分发。然后m1,m2和m3信号在家庭,电影院和/或其它场所重放,处理和再现。再现***包括麦克风矩阵电路129和扬声器矩阵电路131,其由控制处理器133通过各个电路135和137来操作。这允许麦克风信号在收听场所以优化供给扬声器的信号S1-S5的方式来控制和处理,以便用环绕听音区域的特殊唯一扬声器布局来精确再现原始声场。矩阵129从麦克风信号m1,m2和m3来发展零和第一空间谐波信号a0,a1和b1。扬声器矩阵131取这些信号并且用图4对矩阵53所描述的相同算法来产生各个扬声器信号S1-S5。控制台139允许在收听场所的用户指定由矩阵131使用的确切扬声器位置,和需要的任何其它参数。
图6的方案与图5的非常类似,除了在记录或传输的信号上不同。代替在127(图5)记录或传输麦克风信号,麦克风矩阵129在声音始发位置(图6)执行,并且产生的声场空间谐波a0,a1和b1在127′记录或传输。控制处理器141和控制面板143在母版制作场所使用。控制处理器145和控制面板147在收听场所使用。图6***的优点是,记录或传输的信号独立于所使用的麦克风的类型和布局,所以这一信息不需要在收听场所已知。
图5和6麦克风矩阵129的实例在图7中给出。三个麦克风信号m1,m2和m3的每一个都是到一组三个可变增益放大器的输入。信号m1用于放大器151-153,信号m2用于放大器154-156,和信号m3用于放大器157-159。每组放大器的一个输出连接到产生零空间谐波信号a0的求和结点。同样,每组另一个放大器输出连接到求和结点163,其产生第一空间谐波信号a1。进一步,每组第三个放大器的输出在求和结点165连接到一起,提供第一谐波信号b1
放大器151-159的增益单独地由控制处理器133或141(图5或6)通过电路135来设置。这些增益定义麦克风矩阵129的传递函数。必要的传递函数依赖于使用的麦克风121,123和125的类型和布局。图8说明麦克风的一种特殊布局。它们可以是相同的,但不需要如此。仅仅一个麦克风可以是全方向的。作为特殊的实例,每个都是具有心形方向图的压力梯度型麦克风。它们以Y型布局,它们的主敏感性轴箭头方向朝外。麦克风121和125的方向置于另一个麦克风123方向轴相反侧的角度α。
在这个特殊实例中,麦克风信号可以如下表示,其中ν是声源关于麦克风123方向轴的角度:
m1=1+cos(ν-α)
m2=1-cosν                                          (9)
m3=1+cos(ν+α)
矩阵129的三个空间谐波输出,根据它的三个麦克风信号输入,为: a 0 = ( m 1 + m 3 ) 2 + m 2 cos α 1 + cos α a 1 = ( m 1 + m 3 ) 2 - m 2 1 + cos α - - - - ( 10 ) b 1 = m 1 - m 3 2 sin α
因为这些是线性方程,放大器151-159的增益是这些方程每个m1,m2和m3项的系数。
为了说明清楚,不同的声音处理算法根据模拟电路来描述。虽然描述的一些或所有矩阵可以以这种方式来实现,更方便的是,在商业上可用的数字声音母版制作台中当为记录或传输编码信号时,和在收听场所重放设备的数字式电子***中来实现这些算法。然后,矩阵在设备中以数字形式,响应提供的执行上面描述算法的软件或固件代码来形成,。
在母版制作和重放中,矩阵用包括期望的或真实的扬声器位置的参数来形成。对这些扬声器位置几乎不加限制。无论它们是什么,它们都被考虑为不同算法中的参数。获得改进的真实感,而不需要其他技术认为是必需的特殊扬声器位置,例如使用径向相反的扬声器对,置于长方形房间地板和天花板角落的扬声器,其它特殊的直线布局,等等。相反地,本发明的处理允许扬声器首先置于环绕听音区域的期望位置,然后那些位置用作信号处理中的参数以获得通过那些扬声器来再现具有指定数量空间谐波的声音的信号,指定数目的空间谐波其基本上精确地与原始音频波阵面的那些空间谐波相同。
在上面给出的实例中精确再现的空间谐波是零和第一谐波,但是如果有足够的扬声器用来再现,更高的谐波也可以再现。更进一步,信号处理对所有再现的频率是相同的,高质量***从几十赫兹的低频延伸到20,000Hz,或更高。在两个频带中信号单独处理不是必需的。
三维表示
至此,通过认为扬声器和声源处于一个平面,讨论给出二维中空间谐波的方法。这一相同理论可以延伸到三维。它需要4个通道来传输三维空间谐波展开式的第0和第1项。它具有矩阵变换的相同性质,2个通道可以传送标准立体声混音,而另外两个通道可以用来为环绕听者任何数目的扬声器产生供给。遗憾的是,3D形式的数学不像2D的清晰紧凑。没有任何特别好的方法来减少复杂度。
为了将空间谐波方法延伸到三维,勒让德函数和球谐波德的简短讨论是需要的。在某种意义上,这是傅立叶正弦和余弦级数的推广。傅立叶级数是一个角度φ的函数。级数是周期性的并且可以用来表示在一个周期上的函数。正如傅立叶正弦和余弦级数是周期上的正交函数完备集,球谐波也是定义在球表面的正交函数完备集。同样地,球上的任何函数都可以由广义傅立叶级数中的球谐波来表示。
球谐波是球上两个坐标,角度θ和φ的函数。这在图9中表示,其中球表面上的点由对(θ,φ)表示。φ是方位角。0°为直前。90°为向左。180°为直接向后。θ是偏角(上和下)。0°为直接向上。90°为水平面,180°为直接向下。注意θ为0°~180°,而φ为0°~360°(或者-180°~180°)。在二维的讨论中,角变量θ已经被抑制并取作等于90°。一般地说,包括两个角度。例如,在图1中扬声器SP1,SP2,SP3,SP4和SP5的位置现在由各个角度对(θ1,φ1),(θ2,φ2),(θ3,φ3),(θ4,φ4),和(θ5,φ5)给出,其中θi现在为0°~180°。图1和8可以认为是所示部件的共面布局或者三维情况在特殊平面子空间上的投影。
球谐波的一般定义始于勒让德多项式,其定义如下: P n ( μ ) ≡ 1 2 n n ! d n dμ n ( μ 2 - 1 ) n - - - - ( 11 ) 从这,我们可以定义勒让德连带函数,其定义如下: P n m ( μ ) ≡ ( - 1 ) m ( 1 - μ 2 ) m / 2 d m P n ( μ ) dμ m - - - - ( 12 )
其中,P0(cosθ)=1,P1(cosθ)=cosθ,P1 1(cosθ)=-sinθ,等等。勒让德多项式和连带函数都是正交的(但不是标准正交的)。给出这些特殊的定义,因为一些作者定义它们略微不同。如果使用一种可选的定义,下面的方程必须适当地改变。
虽然这些是多项式,它们可以用下面代换变成周期函数:
μ≡cosθ                                      (13)
从这,在极坐标中的函数展开式可以如下得到: f ( θ , φ ) = Σ n = 0 { A n P n ( cos θ ) + Σ m = 1 n ( A nm cos mφ + B nm sin mφ ) P n m ( cos θ ) } - - - - ( 14 )
函数Pn(cosθ),cosmφPn m(cosθ),和sinmφPn m(cosθ)称作球谐波。这一展开式等价于公式(1)的傅立叶级数,但是实际地推导它相对凌乱。一种方法是固定θ值,比方说90°。剩余的项压缩成等价于傅立叶正弦和余弦级数的形式。系数(An,Anm,Bnm)推广公式(1)中的系数(a0,am,bm),对于n≠0。
对仅定义在周期上的函数,对包括0~T阶谐波的级数有1+2T个系数。对于球谐波展开式,系数的总数是(T+1)2,如果包括到T阶的谐波,出现平方因为球面是二维表面。因此,如果保持到第一级的谐波现在需要A0,A1,A11和B11四项,而不是a0,a1和b1三项。
当应用于声音,这可以认为是处于听者所在地中心空间中一点的麦克风球表面上的声压。这一展开式用作向导,贯穿扫视矩阵的产生和可以在环绕听者任何方向发出的声音的麦克风处理。
如在2D的讨论中,我们想要逼近的球面上的函数取作(θ0,φ0)到听者方向上的单位脉冲,额外坐标θ现在变得明确。为了简洁,定义μ0如下:
μ0≡cosθ0                                (15)
在那个方向上的单位脉冲的展开式可以如下计算: f 0 ( θ , φ ) = Σ n = 0 2 n + 1 2 π { 1 2 P n ( μ 0 ) P n ( μ ) + Σ m = 1 n ( n - m ) ! ( n + m ) ! cos m ( φ - φ 0 ) P n m ( μ 0 ) P n m ( μ ) } - - - - ( 16 )
对于在多个不同位置(θ0,φ0)的多个点源或对于非点源,这一函数分别由在这些点上的求和或在分布上的积分来代替。
虽然这里的讨论使用从球坐标产生的三维谐波来给出,可以类似地使用三维中的其它正交函数集。那么,相应的正交函数将作为替代在公式(16)和其它公式中使用。例如,如果听音区域中三维扬声器布局的几何结构使自己适合特殊的坐标系,或者如果关于对应于听者的点的麦克风表面由于麦克风布局或特征模型化为非球面,那么,比方说,可以使用类似球体的坐标系和它对应的正交展开式。
回到图1,N个扬声器在角度(θ1,φ1),(θ2,φ2),...,(θN,φN)环绕听者,但是现在不再使用N的实例值=5和每个θi=90°。寻找到每个扬声器的增益gi,使得产生的环绕中心点的声场尽可能地对应于期望的声场(上面的f0(θ,φ))。这些增益可以通过要求产生的声场和期望的声场之间的积分平方差尽可能小来获得。这一优化的结果是下面的矩阵公式,其用交换左右两边来推广公式(2):
BG=S                                        (17)
其中G是扬声器增益的列向量:
GT=[g1…gN]                                 (18)
矩阵B的分量可以如下计算: b ij = Σ n = 0 2 n + 1 2 π { 1 2 P n ( μ i ) P n ( μ j ) + Σ m = 1 n ( - 1 ) m ( n - m ) ! ( n + m ) ! cos m ( φ i - φ j ) P n m ( μ i ) P n m ( μ j ) } - - - - ( 19 )
S=[b10…bN0]T
注意如果没有(-1)m项,公式(19)类似于某方向上单位脉冲的公式(16)的展开式。虽然第一个求和没有写上限,实际上它将是有限求和。矩阵B的秩依赖于保留展开式的多少项。如果保留第0和第1项,B的秩将为4。如果多取一项,秩将为9。B的秩也决定所需扬声器的最小数目以匹配展开式的许多项。
可以使用任何数目的扬声器,但是如果扬声器的数目不是对应于第T阶谐波的完全平方数(T+1)2,公式的***将是非确定的。有各种方法求解非确定***。一种方式是使用矩阵B的伪逆来求解***。这相当于选择最小范数解法,并且给出完全可接受的解。另一种方法是用强制某些较高谐波为零的公式来扩充***。这包括取保持B的秩的最小数目的行,然后增加如下形式的行:
[Pn+11)…Pn+1N)]=[0]                        (21a)
或者
[cosφ1Pm n+11)…cosφNPm n+1N)]=[0]          (21b)
或者
[sinφ1Pm n+11)…sinφNPm n+1N)]=[0]          (21c)
这些公式是上面用来将公式(3)简化到公式(4)的过程的推广。取这些公式的哪一个确切地并不产生多大的不同。每个额外的行都将增加矩阵的秩直到达到满秩。
这样,我们已经得到产生扬声器增益所需要的矩阵公式,这些扬声器增益用于将单个(单声道)声源扫视进多个扬声器,这些扬声器将精确地保持三维中的某些空间谐波。
图3和4说明两个非立体声声源混合成五个信号,然后转换成到第一级的空间谐波,并且最终矩阵变换成一组修改的信号这一共面实例的母版制作和重建过程。需要注意的是,可以不同地取任意这些特殊选择,虽然记录的五个信号和作为输出产生的五个修改信号的选择是方便的,正如通用多通道方案是5.1格式的电影和家庭电影放映机声轨。可选的多通道录音和再现方法,例如由James A.Moorer于2000年2月17日申请的名称为“CD重放增加”的共同未决美国专利申请系列号09/505,556中所描述的,其在此引入作为参考。
图3和4的方案延伸以包括三维谐波,主要的改变是现在(T+1)2个信号代替(1+2T)个信号为谐波矩阵51的输出,如果保留到T阶的谐波。因此,保持到第一级的谐波现在需要(A0,A1,A11,B11)四项而不是(a0,a1,b1)三项。另外,现在控制处理器59必须从假设的扬声器角度对(θi,φi)和对应的一对真实扬声器角度(γj,βj),而不仅仅是各个方位角φi和βj来计算增益,(γj,βj)也通过控制面板61来提供。最后,对于三维非共面情况的一个方便选择是使用六个信号S1-S6和一组修改的六个信号S1′-S6′。在任何情况下,对于球谐波需要至少四个非共面扬声器,正如在2D情况下需要至少三个非共线扬声器,因为需要至少四个非共面的点来定义球面,三个非共线的点来定义平面中的圆。
六个扬声器是方便选择的原因是,它允许介质15上四或五个记录的或传输的音轨混合用于共面布局,剩余的两个或一个音轨用于处于平面外的扬声器。这允许没有升高的扬声器或没有球谐波再现装置的听者能够访问并使用仅仅四或五个共面音轨,而对于具有完美三维再现能力的听者,剩余的音轨仍然可以在介质上获得。这类似于上面描述的在2D中的情况,其中两个通道可以用于传统立体声再现,而额外的通道可以用于再现声场。在3D的情况中,比方说,六个通道,两个可以用于立体声混音,增加两个用于四通道环绕声录音,最后的两个用于通过六通道进一步增加再现,以提供三维声场。然后听者能够从存储介质访问所需的通道数,例如,在上面引入作为参考的共同未决申请“CD重放增加”中所描述的。
回到图3,那么在这个实例中的改变由对每个非立体声源的包括一个额外放大器和增加以向介质15提供额外信号S6的额外部分组成。然后控制面板29也将为每个源提供额外的增益,现在所有的增益都从假设扬声器布局的偏角以及方位角位置来得到。类似地在图4中,六个信号S1-S6中的每一个将供给矩阵51中的四个放大器,每个放大器用于对应于A0,A1,A11和B11的四个求和结点中的每一个(或者,一般地说,用于这些求和结点的线性组合)以在使用第0和第1级谐波的本实例中的产生这四个输出。对者四个谐波的每一个矩阵53现在具有六个放大器,以产生一组改变的六个信号S1′-S6′。此外,现在使用实际扬声器布局的偏角以及方位角位置。一般地说,控制面板61也可以向控制处理器59提供不与其它扬声器在相同球面上的任何扬声器的径向信息。然后控制处理器59可以使用这一信息矩阵53来产生相应的改变信号以通过引入延迟,波阵面传播的补偿,或两者都引入,来补偿不同的半径。
在本方案中,上面公式(6)的等价变成:
A0=S1+S2+S3+S4+S5+S6
A1=S1cosθ1+S2cosθ2+S3cosθ3+S4cosθ4+S5cosθ5+S6cosθ6
A11=S1cosφ1sinθ1+S2cosφ2sinθ2+S3cosφ3sinθ3                     (6′)
                   +S4cosφ4sinθ4+S5cosφ5sinθ5+S6cosφ6sinθ6
B11=S1sinφ1sinθ1+S2sinφ2sinθ2+S3sinφ3sinθ3
                   +S4sinφ4sinθ4+S5sinφ5sinθ5+S6sinφ6sinθ6
在上面讨论的情况中,其中四个扬声器,比如说S1-S4,取为平行于房间地板的典型共面布局,θ14=90°,则公式(6′)显著地简化。另外,通过具有完美三维再现,到听音区域中任何其它平面上的二维投影可以通过固定适当的θs和φs来实现。
标准定向麦克风具有拾音模式,其可以表示成第0和第1空间球谐波。标准压力梯度麦克风模式的公式如下:
m(θ,φ)=C+(1-C){cosΘcosθ+sinΘsinθcos(φ-Φ)}                   (22)
其中Θ和Φ麦克风主轴球坐标中的角度。简而言之,他们是麦克风“指向”的方向。公式(22)是公式(9)的更一般形式。那些公式对应于公式(22),达到总因子2,具有C=,θ=Θ=90°,φ=v,以及对各个麦克风m1,m2或m3,φ=α,0或-α。常数C称作麦克风的“定向性”,并由麦克风的类型决定。C对于全方向麦克风为1,对于“ 8字”麦克风为0。中间的值产生标准拾音模式,例如心型线(1/2),超心型线(1/4),特级心型线(3/8),和次心型线(3/4)。用四个麦克风,我们可以重新获得3D声场的第0和第1空间谐波,如下: A 0 A 1 A 11 B 11 = D m 1 m 2 m 3 m 4 - - - - ( 23 )
这一公式对应于公式(10)的2D第0和第1空间谐波。公式左边的空间谐波系数有时在商用声场麦克风中称作W,Y,Z和X。通过这四个系数的三维声场的表示有时称作“B-格式”。(命名仅仅是将它和有时称作“A-格式”的直接麦克风供给区分。
项m1,...,mM指向具有主轴在角度(Θ1,Φ1),...,(ΘM,ΦM)的M个压力梯度麦克风。矩阵D的逆矩阵可如下定义: D - 1 = C 1 ( 1 - C 1 ) cos Θ 1 ( 1 - C 1 ) sin Θ 1 cos Φ 1 ( 1 - C 2 ) sin Θ 1 sin Φ 1 C 2 ( 1 - C 2 ) cos Θ 2 ( 1 - C 2 ) sin Θ 2 cos Φ 2 ( 1 - C 2 ) sin Θ 2 sin Φ 2 C 3 ( 1 - C 3 ) cos Θ 3 ( 1 - C 3 ) sin Θ 3 cos Φ 3 ( 1 - C 3 ) sin Θ 3 sin Φ 3 C 4 ( 1 - C 4 ) cos Θ 4 ( 1 - C 4 ) sin Θ 4 cos Φ 4 ( 1 - C 4 ) sin Θ 4 sin Φ 4 - - - - ( 24 )
这一矩阵的每一行正好是一个麦克风的方向模式。四个麦克风清楚地确定球谐波展开式第0和第1阶项的所有系数。麦克风的角度应该是各不相同的(不应该有两个麦克风指向相同的方向)和非共面的(因为那将仅在一个角度上提供的信息而不是两个)。在这些情况中,矩阵是情况良好的并具有逆矩阵。
在图5,6和7中也将需要相应的改变。在图5和6中,麦克风的数量现在是四,对应于公式(23)中的m1-m4,并且四个谐波(A0,A1,A11,A11或四个独立线性组合)代替三项(a0,a1,b1)。输出信号的数量也将调整,在上面使用的实例中,现在包括S6和S6′。另外,每个麦克风的定位现在由一对参数角度(Θ,Φ)--主轴来指定,并且每个信号S1-S6或S1′-S6′具有偏角及方位角。图7的麦克风矩阵现在将相应地具有四组四个放大器。
公式(23)和(24)的四个麦克风的一种可能布局是将m1-m3如图8放置在赤道平面上,m4位于球的北极。这对应于(Θ1,Φ1),(Θ3,Φ3)=(90°,±α),(Θ2,Φ2)=(90°,180°),Θ4=0°。另一种可选的布局是如图10中所示放置麦克风,具有两个向后朝向的麦克风,m1121在(90°,α),m2123在(90°+δ,180°),m3125在(90°,-α),和m4126在(90°-δ,180°)。取α=δ=60°,那么产生正四面体布局。
在某些应用中,一个麦克风可以因实际原因放置在不同的半径,在这种情况下,应该引入相应信号的某些延迟或提前。例如,如果图8的后向麦克风m2向后位移,那么对每一英尺的位移录音提前大约1ms以补偿传播时间的不同。
公式(23)对于任一组四个麦克风都是有效的,再次假设至多一个麦克风是全方向的。通过看两个不同麦克风组的这一公式,拾音的方向模式可以通过将这四个信号矩阵变换来改变。开始点是两个不同麦克风组的公式(23)和(24)以及它们相应的矩阵D。实际的麦克风和矩阵将由字母m和D来表示,由~表示重新矩阵变换的“虚拟”量。
给定公式(23)和(24)的公式表示,这些麦克风供给可以转换成一组“虚拟”麦克风供给组,如下: m ~ 1 m ~ 2 m ~ 3 m ~ 4 = D ~ - 1 A 0 A 1 A 11 B 11 = D ~ - 1 D m 1 m 2 m 3 m 4 - - - - ( 25 )
矩阵
Figure A0081956100252
表示“虚拟”麦克风的方向性和角度。其结果将是记录的声音,如果虚拟麦克风出现于录音而不是所使用的麦克风。这允许使用“普通的”声场麦克风来制作录音,然后将它们矩阵变换成任意的麦克风组。例如,我们可以仅挑选头两个虚拟麦克风,
Figure A0081956100253
并将它们用作标准CD录音的立体声对。然后可为上面描述的那种平面环绕声录音加入
Figure A0081956100256
用于完美三维实现。
这四个麦克风供给的任何非退化传输可以用来产生任何其它的一组麦克风供给,和可以用来产生任何数目扬声器(大于4)的扬声器供给,这些扬声器可以精确地重新产生原始声场的第0和第1空间谐波。换句话说,在录音完成后,声场的麦克风技术可以用来调整麦克风的方向特征和角度。这样,通过在2D情况下增加第三个后向的麦克风和在3D情况下增加第四个非共面的麦克风,麦克风可以通过简单的矩阵操作来修改。无论是否打算在多通道格式中释放材料,第三个后向通道的记录允许立体声释放中增加的自由度,第四个非共面通道的录音在立体声和平面环绕声中都增加自由度。
为了将麦克风供给矩阵变换给多个扬声器,为了扫视,我们重新用公式表示矩阵公式(17)的右边,如下: BG = R = R 1 D m 1 m 2 m 3 m 4 - - - - ( 26 ) 以及 R 1 = P 0 ( μ 1 ) P 1 ( μ 1 ) - cos φ 1 P 1 1 ( μ 1 ) - sin φ 1 P 1 1 ( μ 1 ) · · · P 0 ( μ N ) P 1 ( μ N ) - cos φ N P 1 1 ( μ N ) - sin φ N P 1 1 ( μ N ) - - - - ( 27 )
矩阵R1只是在扬声器位置估计的第0和第1级空间谐波。必须注意要包括(-1)m项,因为那是获得这些公式所需的最小平方优化的直接结果。
回到声场的录音,分别对应于2D和3D声场的三个或四个通道(最优地非压缩)声音材料可以存储于磁盘或其它介质上,然后以简单的方式重新矩阵变换成立体声或环绕声。由公式(25)(或它的2D简化),以无损的方式,有无穷多个四个通道到四个其它通道的非退化传输。这样,代替存储空间谐波,两个通道可以存储适当的立体声混音,第三个存储2D环绕混音的通道,以及第四个通道用于3D环绕混音。除声音之外,矩阵 或它的逆也可以存储在介质上。对于立体声表示,操作者简单地忽略声频的第三和第四通道,并且将另外两个作为左和右供给而播放。对于2D环绕表示,矩阵 的逆用来从前三个通道中获得第0和第1阶2D空间谐波。从空间谐波,形成例如公式(8)的矩阵或公式(17)的平面投影,并计算扬声器供给。对于3D环绕表示,3D谐波使用所有四个通道来
Figure A0081956100265
中得到,以形成公式(17)的矩阵并计算扬声器供给。
虽然本发明的各个方面已经关于它们的优选实施方案来描述,应该认识到,本发明在附加的权利要求书的全部范围中授予保护。

Claims (30)

1.一种处理声场的方法,用于在给定的频率范围上通过具有多个分别供给至少四个扬声器中一个的至少四个通道的环绕声***来再现声场,包括:
获得声场的多路信号,和
以具有全频率范围的一组相对增益,将获得的声场信号导向多个通道中的各个通道,这通过求解下面的关系来确定:(1)包括选择的环绕听音区域的扬声器位置,不局限于规则几何的,共面的模式,(2)基本上保持声场多个三维空间谐波的各个谐波。
由此,从布局在所述选择位置的扬声器再现的声场基本上再现所获得声场的多个三维空间谐波。
2.根据权利要求1的方法,其中基本上保持的三维空间谐波的数目仅包括零和第一阶谐波。
3.根据权利要求1的方法,其中基本上保持的三维空间谐波的数目包括零到第n阶谐波,其中n是整数,等于或小于扬声器数目的平方根减1。
4.根据权利要求1的方法,其中获得的声场多路信号包括获得希望置于环绕听音区域指定位置的声音的多路非立体声信号,以及所述关系包括这些指定位置,由此,从扬声器再现的声场又包括在所述指定位置的非立体声声音。
5.根据权利要求1的方法,其中获得的声场多路信号包括声场中的定位多重定向麦克风。
6.根据权利要求1的方法,其中该组相关增益至少部分地由包括扬声器环绕某些听音区域的假设位置的关系来确定。
7.根据权利要求1的方法,其中该组相关增益至少部分地在与听音区域相邻的位置由包括扬声器环绕听音区域的实际位置的关系来确定。
8.根据权利要求1的方法,其中该组相关增益又由导致速度和功率向量基本上对准的因素来确定。
9.根据权利要求1的方法,其中该组相关增益又由导致所述多个三维空间谐波的第二或更高阶最小化的因素来确定。
10.根据权利要求1-9中任何一个的方法,其中环绕声***确切地具有六个通道,其分别供给确切地六个扬声器的不同的一个。
11.根据权利要求10的方法,其中所述确切六个扬声器的至少一个置于与所述确切六个扬声器的其它扬声器非共面。
12.一种在多通道环绕声***中模拟声音的希望视在三维位置的方法,包括:
非立体声地获得声音,该声音的三维位置希望被模拟,
以一组相对增益,将获得的非立体声声音导向多个通道中的各个通道,这通过求解声音希望的视在位置相对于一点的偏角和方位角,与对应于由多路通道信号中各个信号驱动的扬声器的期望位置的环绕所述点延伸的一组角位置之间的关系来确定,所述关系以基本上保持声音的至少零和第一阶三维谐波的方式来求解,这种方式当通过处于期望位置的扬声器再现声音时,好像非立体声声音确实出现于所述视在位置。
13.权利要求12的方法,其中扬声器真实地放置,所述扬声器中至少一个具有不同于期望位置的真实位置,并且另外还包括通过求解包括扬声器真实位置的第二关系和以保持声音的至少零和第一阶三维谐波的各个值的方式计算用于驱动扬声器的一组修改的相对增益,这种方式当通过处于真实位置的扬声器再现时,好像非立体声声音确实出现于所述视在位置。
14.根据权利要求12或13任何一个的方法,其中该组相对增益又由导致通过扬声器再现的声场的速度和功率向量基本上对准的因素来确定。
15.根据权利要求12或13任何一个的方法,其中该组相对增益又由导致通过扬声器再现的声场的第二或更高阶三维空间谐波最小化的因素来确定。
16.根据权利要求12或13任何一个的方法,其中通道的数目是四或更多。
17.根据权利要求12或13任何一个的方法,其中通道的数目确切为六。
18.根据权利要求16的方法,其中扬声器期望位置中至少一个与扬声器期望位置中的其他位置非共面。
19.一种通过环绕听音区域放置的四个或更多扬声器再现三维声场的方法,包括:
获得代表声场的多个电信号,
以一种方式处理所述多个电信号,产生所述声场至少零和第一阶三维空间谐波的信号,
以一种方式处理三维空间谐波信号,以通过求解包括扬声器真实位置的项的关系来确定供给各个扬声器的信号的相对增益,当求解时,基本上保持通过扬声器再现的声场的至少零和第一阶三维谐波,分别匹配所获得声场的零和第一阶三维谐波。
20.根据权利要求19的方法,其又包括记录和重放代表声场的多个电信号。
21.根据权利要求19的方法,其又包括记录和重放声场谐波的信号。
22.根据权利要求19-21中任何一个的方法,其中声场通过确切六个扬声器来再现。
23.根据权利要求20的方法,其中所述确切六个扬声器至少一个置于与所述确切六个扬声器的其他扬声器非共面。
24.一种声音再现***,其具有接收原始声场至少四个音频信号的输入设备,该原始声场将要由位于环绕听音区域的某些假设位置的至少四个扬声器的各个扬声器来再现,具有驱动位于不同于假设位置的环绕听音区域的某些实际位置的至少四个扬声器的输出设备,包括:
输入设备,其接收信息,包括扬声器某些实际位置的偏角和方位角,
用电子学方法实现的矩阵,响应输入的实际扬声器位置信息,包括偏角和方位角,和响应假设的扬声器位置,以从输入信号向驱动扬声器以再现具有一定数目三维空间谐波的声场的输出设备提供其他信号,再现声场的那些空间谐波与原始声场中相同数目三维空间谐波的各个谐波基本上分别匹配。
25.根据权利要求24的声音***,其中矩阵进一步包括:
第一部分,从假设扬声器位置信息和输入信号来推导对应于三维空间谐波数的各个信号,
第二部分,从三维空间谐波信号和实际扬声器位置信息来推导真实扬声器的各个信号。
26.根据权利要求24或25任何一个的声音***,其中匹配的三维空间谐波的数包括零和第一阶谐波。
27.根据权利要求24或25任何一个的声音***,其中匹配的三维空间谐波的数只包括零和第一阶谐波。
28.根据权利要求24或25任何一个的声音***,其中位于实际扬声器位置的扬声器数目包括六个。
29.根据权利要求25的声音***,其中所述实际扬声器位置中至少一个置于与所述实际扬声器位置中其他位置非共面。
30.一种声音***,其具有接收原始三维声场音频信号的输入设备,和驱动位于环绕听音区域的某些实际位置的至少四个扬声器以再现声场的输出设备,包括:
输入设备,其接收扬声器实际位置的信息,以及
用电子学方法实现的矩阵,响应输入的实际扬声器位置信息和输入信号以向输出设备提供信号,这些输出设备驱动扬声器以再现具有一定数目三维空间谐波的声场,这些空间谐波与原始声场相同数目三维空间谐波中对应的谐波基本上分别匹配。
CN 00819561 2000-04-19 2000-10-06 保持三维中的空间谐波的多通道环绕声母版制作和再现技术 Pending CN1452851A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/552,378 US6904152B1 (en) 1997-09-24 2000-04-19 Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
US09/552,378 2000-04-19

Publications (1)

Publication Number Publication Date
CN1452851A true CN1452851A (zh) 2003-10-29

Family

ID=24205070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 00819561 Pending CN1452851A (zh) 2000-04-19 2000-10-06 保持三维中的空间谐波的多通道环绕声母版制作和再现技术

Country Status (6)

Country Link
EP (1) EP1275272B1 (zh)
JP (1) JP4861593B2 (zh)
CN (1) CN1452851A (zh)
AU (1) AU2000280030A1 (zh)
CA (1) CA2406926A1 (zh)
WO (1) WO2001082651A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102695116A (zh) * 2012-05-30 2012-09-26 蒋憧 一种声音采集、处理和再现方法
CN102752701A (zh) * 2012-07-10 2012-10-24 武汉大学 一种三维空间方位感知敏感度的测试装置及方法
CN101470756B (zh) * 2007-12-20 2012-12-26 汤姆森许可贸易公司 用于计算视听文件的显著性的方法和设备
CN102932730A (zh) * 2012-11-08 2013-02-13 武汉大学 一种正四面体结构的扬声器组声场效果增强方法及***
CN103583054A (zh) * 2010-12-03 2014-02-12 弗兰霍菲尔运输应用研究公司 经由根据抵达方向估算提取几何信息的声音获取

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2379147B (en) * 2001-04-18 2003-10-22 Univ York Sound processing
JP4016681B2 (ja) * 2002-03-18 2007-12-05 ヤマハ株式会社 効果付与装置
FR2847376B1 (fr) * 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
FR2858403B1 (fr) * 2003-07-31 2005-11-18 Remy Henri Denis Bruno Systeme et procede de determination d'une representation d'un champ acoustique
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
US8908873B2 (en) 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
WO2009093866A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing an audio signal
WO2009093867A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing audio signal
KR100998913B1 (ko) * 2008-01-23 2010-12-08 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
ES2425814T3 (es) * 2008-08-13 2013-10-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para determinar una señal de audio espacial convertida
GB2478834B (en) 2009-02-04 2012-03-07 Richard Furse Sound system
KR102018824B1 (ko) 2010-03-26 2019-09-05 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
AU2012279357B2 (en) 2011-07-01 2016-01-14 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering
US8996296B2 (en) * 2011-12-15 2015-03-31 Qualcomm Incorporated Navigational soundscaping
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) * 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2733964A1 (en) 2012-11-15 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Segment-wise adjustment of spatial audio signal to different playback loudspeaker setup
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
US9959875B2 (en) * 2013-03-01 2018-05-01 Qualcomm Incorporated Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9103207D0 (en) * 1991-02-15 1991-04-03 Gerzon Michael A Stereophonic sound reproduction system
US5757927A (en) * 1992-03-02 1998-05-26 Trifield Productions Ltd. Surround sound apparatus
JPH08130793A (ja) * 1994-11-01 1996-05-21 Mitsubishi Electric Corp 音響再生装置
JPH1118199A (ja) * 1997-06-26 1999-01-22 Nippon Columbia Co Ltd 音響処理装置
AU6400699A (en) * 1998-09-25 2000-04-17 Creative Technology Ltd Method and apparatus for three-dimensional audio display

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470756B (zh) * 2007-12-20 2012-12-26 汤姆森许可贸易公司 用于计算视听文件的显著性的方法和设备
US8374492B2 (en) 2007-12-20 2013-02-12 Thomson Licensing Method and device for calculating the salience of an audio video document
CN103583054A (zh) * 2010-12-03 2014-02-12 弗兰霍菲尔运输应用研究公司 经由根据抵达方向估算提取几何信息的声音获取
US9396731B2 (en) 2010-12-03 2016-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Sound acquisition via the extraction of geometrical information from direction of arrival estimates
CN103583054B (zh) * 2010-12-03 2016-08-10 弗劳恩霍夫应用研究促进协会 用于产生音频输出信号的装置和方法
US10109282B2 (en) 2010-12-03 2018-10-23 Friedrich-Alexander-Universitaet Erlangen-Nuernberg Apparatus and method for geometry-based spatial audio coding
CN102695116A (zh) * 2012-05-30 2012-09-26 蒋憧 一种声音采集、处理和再现方法
CN102695116B (zh) * 2012-05-30 2015-06-03 蒋憧 一种声音采集、处理和再现方法
CN102752701A (zh) * 2012-07-10 2012-10-24 武汉大学 一种三维空间方位感知敏感度的测试装置及方法
CN102752701B (zh) * 2012-07-10 2014-09-17 武汉大学 一种三维空间方位感知敏感度的测试装置及方法
CN102932730A (zh) * 2012-11-08 2013-02-13 武汉大学 一种正四面体结构的扬声器组声场效果增强方法及***
CN102932730B (zh) * 2012-11-08 2014-09-17 武汉大学 一种正四面体结构的扬声器组声场效果增强方法及***

Also Published As

Publication number Publication date
EP1275272A1 (en) 2003-01-15
JP4861593B2 (ja) 2012-01-25
JP2003531555A (ja) 2003-10-21
CA2406926A1 (en) 2001-11-01
EP1275272B1 (en) 2012-11-21
WO2001082651A1 (en) 2001-11-01
AU2000280030A1 (en) 2001-11-07

Similar Documents

Publication Publication Date Title
CN1452851A (zh) 保持三维中的空间谐波的多通道环绕声母版制作和再现技术
US6904152B1 (en) Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
CN1275498C (zh) 声道转换方法
CN104429102B (zh) 使用3d音频分层译码的扩音器位置补偿
US10225676B2 (en) Hybrid, priority-based rendering system and method for adaptive audio
RU2533437C2 (ru) Способ и устройство для кодирования и оптимальной реконструкции трехмерного акустического поля
CN101341793B (zh) 从立体声信号产生多声道音频信号的方法
CN105264914B (zh) 音频再生装置以及方法
US20180255417A1 (en) Applications and format for immersive spatial sound
CN100588286C (zh) 产生低频声道的设备与方法
CN109996166A (zh) 声音处理装置和方法、以及程序
WO2017182714A1 (en) Merging audio signals with spatial metadata
CN102318372A (zh) 声音***
JP5826996B2 (ja) 音響信号変換装置およびそのプログラム、ならびに、3次元音響パンニング装置およびそのプログラム
CN1849845A (zh) 用于产生、存储或加工音频场景的音频表示的设备和方法
CN108140389A (zh) 空间向量的量化
CN107147975B (zh) 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法
CN108632709B (zh) 一种沉浸式宽带3d声场重放方法
Paterson et al. 3D Audio
EP1558061A2 (en) Sound Feature Positioner
JPWO2019208285A1 (ja) 音像再現装置、音像再現方法及び音像再現プログラム
WO2020100670A1 (ja) 信号処理装置および方法、並びにプログラム
Fonseca Particle Systems for Creating Highly Complex Sound Design Content
JP2024026010A (ja) 音場再現装置、音場再現方法及び音場再現システム
Nettingsmeier Higher order Ambisonics-a future-proof 3D audio technique

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication