CN106664480B - 用于声波场生成的***和方法 - Google Patents

用于声波场生成的***和方法 Download PDF

Info

Publication number
CN106664480B
CN106664480B CN201580016986.4A CN201580016986A CN106664480B CN 106664480 B CN106664480 B CN 106664480B CN 201580016986 A CN201580016986 A CN 201580016986A CN 106664480 B CN106664480 B CN 106664480B
Authority
CN
China
Prior art keywords
microphones
spkr
speaker
microphone
around
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580016986.4A
Other languages
English (en)
Other versions
CN106664480A (zh
Inventor
M.克里斯托夫
L.肖尔茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harman Becker Automotive Systems GmbH
Original Assignee
Harman Becker Automotive Systems GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harman Becker Automotive Systems GmbH filed Critical Harman Becker Automotive Systems GmbH
Publication of CN106664480A publication Critical patent/CN106664480A/zh
Application granted granted Critical
Publication of CN106664480B publication Critical patent/CN106664480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

一种***和方法,其被配置来在目标扬声器‑房间‑麦克风***中的聆听位置周围生成声波场,其中,K≥1组扬声器的扬声器阵列,其中每一组扬声器具有至少一个扬声器,被安置在所述聆听位置周围,且M≥1组麦克风的的麦克风阵列,其中每一组麦克风具有至少一个麦克风,被安置在所述聆听位置处。所述***和方法包括在所述K组扬声器的信号路径上游和输入信号路径的下游中利用可控制传递函数进行均衡滤波。所述***和方法还包括基于来自所述K组麦克风的误差信号和所述输入信号路径上的输入信号根据自适应控制算法来利用所述可控制传递函数的均衡控制信号进行控制用于均衡滤波。所述麦克风阵列包括至少两个第一组麦克风,其环状安置在听者的头部周围、人工头部周围或其中或刚球周围或其中。

Description

用于声波场生成的***和方法
技术领域
本公开涉及用于生成声波场的***和方法。
背景技术
空间声场再生技术利用多个扬声器而在大型聆听区域内创建虚拟听觉场景。若干声场再生技术例如波场合成(WFS)或环境立体学声(Ambisonics),利用配备有多个扬声器的扬声器阵列来提供声学场景的高度详细的空间再生。详细而言,波场合成用来通过使用(例如) 数十至数百个扬声器组成的阵列而实现声学场景的高度详细的空间再生,从而克服限制因素。
空间声场再生技术克服立体声再生技术的一些限制因素。然而,技术约束会阻止使用较大数量的扬声器进行声音再生。波场合成 (WFS)和环境立体学声是两种类似的声场再生。尽管它们是基于声场的不同表现形式(WFS采用基尔霍夫-亥姆霍兹(Kirchhoff-Helmholtz) 积分,而环境立体学声采用球谐展开),但是其目标是一致的,并且其属性是相似的。对用于扬声器阵列圆形设置的这两种原理的现有人为现象进行分析所得出的结论是高阶环境立体学声(HOA)或更准确而言近场校正HOA以及WFS满足类似的限制因素。就感知的过程和品质而言,WFS和HOA及其不可避免的缺陷会造成一些差异。在 HOA中,在再生的阶数降低的情况下,声场的受损重建将会导致定位焦点的模糊以及聆听区域尺寸某种程度的减小。
对于音频再生技术(诸如波场合成(WFS)或环境立体学声)而言,扬声器信号通常根据基础理论来确定,使得扬声器在其已知位置上发出的声场的叠加描述某个期望声场。通常,扬声器信号是在假定自由场条件的情况下加以确定。因此,聆听房间不应展现明显的壁反射,因为反射波场的反射部分会使再生的波场失真。在许多案例中 (诸如汽车内部),实现此类房间属性的必要声学处理可能过于昂贵或者不切实际。
发明内容
一种***,其被配置来在目标扬声器-房间-麦克风***中的聆听位置周围生成声波场,其中,具有K≥1组扬声器的扬声器阵列,其中每一组扬声器具有至少一个扬声器,被安置在所述聆听位置周围,而M≥1组麦克风的麦克风阵列,其中每一组麦克风具有至少一个麦克风,被安置在所述聆听位置处。所述***包括K个均衡滤波器模块,其布置在所述扬声器的组的信号路径上游和输入信号路径的下游中,并且具有可控制传递函数。所述***还包括K个滤波器控制模块,其被布置在所述麦克风的组的信号路径下游和所述输入信号路径的下游中,并且基于来自所述K组麦克风的误差信号和所述输入信号路径上的输入信号根据自适应控制算法来控制所述K个均衡滤波器模块的所述传递函数。所述麦克风阵列包括至少两个第一组麦克风,其环状安置在听者的头部周围、人工头部周围或其中或刚球周围或其中。
一种方法,其被配置来在目标扬声器-房间-麦克风***中的聆听位置周围生成声波场,其中,K≥1组扬声器的扬声器阵列,其中每一组扬声器具有至少一个扬声器,被安置在所述聆听位置周围,而M≥1 组麦克风的麦克风阵列,其中每一组麦克风具有至少一个麦克风,被安置在所述聆听位置处。所述方法包括在所述K组扬声器的信号路径上游和输入信号路径的下游中利用可控制传递函数进行均衡滤波。所述方法还包括基于来自所述K组麦克风的误差信号和所述输入信号路径上的输入信号根据自适应控制算法来利用所述可控制传递函数的均衡控制信号进行控制用于均衡滤波。所述麦克风阵列包括至少两个第一组麦克风,其环状安置在听者的头部周围、人工头部周围或其中或刚球周围或其中。
本领域技术人员将在查阅以下图式和详述之后了解或更加明白其它***、方法、特征和优点。意图使所有此类额外***、方法、特征和优点都包括在本说明书内,包括在本发明的范围内,并且由随附的权利要求书加以保护。
附图说明
参阅以下附图和描述可更好地理解所述***和方法。图中的组件无需按比例绘制,而是着重说明本发明的原理。此外,图中的相同参考数字指定不同视图中各处的对应部件。
图1是流程图,其说明具有M个记录通道(麦克风)和K个输出通道(扬声器)的简单声学多输入多输出(MIMO)***,包括多误差最小均方(MELMS)***或方法。
图2是流程图,其说明适用于图1所示的MIMO***中的1×2× 2MELMS***或方法。
图3是说明呈限制群延迟函数(群延迟差异与频率)形式的预振铃约束曲线的图。
图4是说明从图3所示曲线导出的限制相位函数(相位差异曲线余频率)的曲线的图。
图5是振幅时间图,其说明根据图4所示曲线而设计的全通滤波器的脉冲响应。
图6是波特(Bode)图,其说明图5所示的全通滤波器的幅度和相位行为。
图7是说明用于在车辆中生成个别声音区的设置。
图8是幅度频率图,其说明使用仅仅基于较遥远扬声器的MIMO ***的图7所示设置中的四个区(位置)中的每一个处的幅度频率响应。
图9是振幅时间图(样本中时间),其说明MIMO***的均衡器滤波器的形成图8所示的图的基础的对应脉冲响应。
图10是具有适用于图7所示设置中的整合式近距离扬声器的头枕的示意图。
图11是图7所示设置中的近距离扬声器的可替代布置的示意图。
图12是更详细说明图11所示的可替代布置的示意图。
图13是幅度频率图,其说明当使用滤波器长度一半的建模延迟和仅仅近距离扬声器时图7所示设置中的四个位置处的频率特性。
图14是振幅时间图,其说明对应于MIMO***的均衡滤波器的脉冲响应,所述脉冲响应导致图13所示的四个期望位置处的频率特性。
图15是幅度频率图,其说明当使用长度减小的建模延迟和仅仅近距离扬声器时图7所示设置中的四个位置处的频率特性。
图16是振幅时间图,其说明对应于MIMO***的均衡滤波器的脉冲响应,所述脉冲响应导致图15所示的四个期望位置处的频率特性。
图17是幅度频率图,其说明当使用长度减小的建模延迟和仅仅***扬声器(即远距离扬声器)时图7所示设置中的四个位置处的频率特性。
图18是振幅时间图,其说明对应于MIMO***的均衡滤波器的脉冲响应,所述脉冲响应导致图17所示的四个期望位置处的频率特性。
图19是幅度频率图,其说明当使用实施预振铃约束而非建模延迟和仅仅近距离扬声器的全通滤波器时,图7所示设置中的四个位置处的频率特性。
图20是振幅时间图,其说明对应于MIMO***的均衡滤波器的脉冲响应,所述脉冲响应导致图19所示的四个期望位置处的频率特性。
图21为振幅频率图,其说明对数域中的示例性幅度约束的上限阈值和下限阈值。
图22是具有基于上文结合图2所描述的***和方法的幅度约束的MELMS***或方法的流程图。
图23是如图22所示使用幅度约束的***或方法的波特图(幅度频率响应、相位频率响应)。
图24是不使用幅度约束的***或方法的波特图(幅度频率响应、相位频率响应)。
图25是幅度频率图,其说明当使用仅仅八个更遥远扬声器组合幅度和预振铃约束的组合时图7所示设置中的四个位置处的频率特性。
图26是振幅时间图,其说明对应于MIMO***的均衡滤波器的脉冲响应,所述脉冲响应导致图25所示的四个期望位置处的频率特性。
图27是幅度频率图,其说明当使用仅仅更遥远扬声器组合基于利用高斯窗的开窗的预振铃约束和幅度约束时图7所示设置中的四个位置处的频率特性。
图28是振幅时间图,其说明对应于MIMO***的均衡滤波器的脉冲响应,所述脉冲响应导致图27所示的四个期望位置处的频率特性。
图29是说明示例性高斯窗的振幅时间图。
图30是利用基于上文结合图2所描述的***和方法的开窗幅度约束的MELMS***或方法的流程图。
图31是当使用仅仅更遥远扬声器组合基于利用修改高斯窗的开窗预振铃约束和幅度约束时***或方法的波特图(幅度频率响应、相位频率响应)。
图32是说明示例性修改高斯窗的振幅时间图。
图33是具有基于上文结合图22所描述的***和方法的空间约束的MELMS***或方法的流程图。
图34是具有基于上文结合图22所描述的***和方法的可替代空间约束的MELMS***或方法的流程图。
图35是具有基于上文结合图34所描述的***和方法的频率相关增益约束LMS的MELMS***或方法的流程图。
图36是幅度频率图,其说明当使用分频滤波器时对应于四个更遥远扬声器的频率相关增益约束。
图37是幅度频率图,其说明当使用仅仅更遥远扬声器组合预振铃约束、开窗幅度约束和自适应频率(相关增益)约束时图7所示设置中的四个位置处的频率特性。
图38是振幅时间图,其说明对应于MIMO***的均衡滤波器的脉冲响应,所述脉冲响应导致图37所示的四个期望位置处的频率特性。
图39是当使用仅仅更遥远扬声器组合预振铃约束、开窗幅度约束和自适应频率(相关增益)约束时的***或方法的波特图。
图40是基于上文结合图34所描述的***和方法具有可替代频率 (相关增益)约束的MELMS***或方法的流程图。
图41是幅度频率图,其说明当使用仅仅更遥远扬声器组合房间脉冲响应中的预振铃约束、开窗幅度约束和可替代频率(相关增益) 约束时,在应用的均衡滤波器的情况下,图7所示设置中的四个位置处的频率特性。
图42是振幅时间图,其说明对应于MIMO***的均衡滤波器的脉冲响应,所述脉冲响应导致图41所示的四个期望位置处的频率特性。
图43是当使用仅仅更遥远扬声器组合房间脉冲响应中的预振铃约束、开窗幅度约束和可替代频率(相关增益)约束时,应用到图7 所示设置的均衡滤波器的波特图。
图44是示意图,其说明针对预掩蔽、同时掩蔽和后掩蔽的声压级与时间。
图45是说明呈限制群延迟函数形式的后振铃约束曲线的图,所述限制群延迟函数表示群延迟差异与频率的关系。
图46是说明从图45所示曲线导出的限制相位函数曲线的图,所述限制相位函数表示相位差异曲线与频率的关系。
图47是说明示例性时间限制函数的曲线的级别时间图。
图48是基于上文结合图40所描述的***和方法具有组合式幅度后振铃约束的MELMS***或方法的流程图。
图49是幅度频率图,其说明当使用仅仅更遥远扬声器组合预振铃约束、基于幅度约束的非线性平滑、频率(相关增益)约束和后振铃约束时,在应用均衡滤波器的情况下,图7所示设置中的四个位置处的频率特性。
图50是振幅时间图,其说明对应于MIMO***的均衡滤波器的脉冲响应,所述脉冲响应导致图49所示的四个期望位置处的频率特性。
图51是当使用仅仅更遥远扬声器组合预振铃约束、基于幅度约束的非线性平滑、频率(相关增益)约束和后振铃约束时,应用到图7 所示设置的均衡滤波器的波特图。
图52是说明示例性级别限制函数的曲线的幅度时间图。
图53是与图52所示的幅度时间曲线相对应的振幅时间图。
图54是幅度时间图,其说明在三个不同频率处具有指数窗的示例性窗函数的曲线。
图55是幅度频率图,其说明当使用仅仅更遥远扬声器组合预振铃约束、幅度约束、频率(相关增益)约束和开窗后振铃约束时,在应用均衡滤波器的情况下,图7所示设置中的四个位置处的频率特性。
图56是振幅时间图,其说明MIMO***的均衡滤波器的脉冲响应,所述脉冲响应造成图55所示的四个期望位置处的频率特性。
图57是当使用仅仅更遥远扬声器组合预振铃约束、幅度约束、频率(相关增益)约束和开窗后振铃约束时,在应用均衡滤波器的情况下,应用到图7所示设置的均衡滤波器的波特图。
图58是幅度频率图,其说明针对明亮区的调性的示例性目标函数。
图59是振幅时间图,其说明具有和不具有所应用的开窗的示例性均衡滤波器的线性域中的脉冲响应。
图60是幅度时间图,其说明具有和不具有所应用的开窗的示例性均衡滤波器的对数域中的脉冲响应。
图61是幅度频率图,其说明当使用所有扬声器组合预振铃约束、幅度约束、频率(相关增益)约束和开窗后振铃约束,并且明亮区处的响应被调整到图58所描绘的目标函数时,在应用均衡滤波器的情况下,图7所示设置中的四个位置处的频率特性。
图62是振幅时间图,其说明MIMO***的均衡滤波器的脉冲响应,所述脉冲响应导致图61所示的四个期望位置处的频率特性。
图63是用于使用修改MELMS算法来再生波场或虚拟源的***和方法的流程图。
图64是用于使用修改MELMS算法来再生对应于5.1扬声器设置的虚拟源的***和方法的流程图。
图65是用于减小在车辆的驾驶员位置处对应于5.1扬声器设置的虚拟源的均衡滤波器模块布置的流程图。
图66是使用修改MELMS算法来在车辆的所有四个位置处生成对应于5.1扬声器设置的虚拟声源的***和方法的流程图。
图67是说明达到四阶的球谐函数的图。
图68是使用修改MELMS算法而用于在目标房间中、在独特位置处生成球谐函数的***和方法的流程图。
图69是说明安置在头带上的二维测量麦克风阵列的示意图。
图70是说明安置在刚球上的三维测量麦克风阵列的示意图。
图71是说明安置在两个耳机上的三维测量麦克风阵列的示意图。
图72是流程图,其说明用于向幅度约束提供整合式后振铃约束的示例性图。
具体实施方式
图1是用于均衡多输入多输出(MIMO)***的***和方法的信号流程图,所述***可以具有多个输出(例如,用于向K≥1组扬声器供应输出信号的输出通道)和多个(误差)输入(例如,用于从M≥1 组麦克风接收输入信号的记录通道)。一组包括连接到单个通道(即,一个输出通道或一个记录通道)的一个或多个扬声器或麦克风。假定对应房间或扬声器房间麦克风***(布置有至少一个扬声器和至少一个麦克风的房间)是线性且非时变的,并且可以通过(例如)其房间声学脉冲响应进行描述。此外,Q个原始输入信号(诸如单输入信号x(n))可以被馈送到MIMO***的(原始信号)输入中。MIMO***可以使用多误差最小均方(MELMS)算法进行均衡,但是也可以采用任何其它自适应控制算法,诸如(修改)最小均方(LMS)、递归最小平方(RLS)等。输入信号x(n)通过M个主要路径101进行滤波,并且在主要路径101的末端上(即在M个麦克风处)提供M个期望信号 d(n),其中所述M个主要路径101由输入信号x(n)从一个扬声器至不同位置处的M个麦克风的通路上的主要路径滤波器矩阵P(z)来表示。
通过可以实施于MELMS处理模块106中的MELMS算法,由均衡滤波器模块103所实施的滤波器矩阵W(z)经过控制来改变原始输入信号x(n),使得所得K个输出信号与期望信号d(n)相匹配,其中所述K个输出信号被供应给K个扬声器,并且由具有次级路径滤波器矩阵S(z)的滤波器模块104进行滤波。因此,MELMS算法会评估利用次级路径滤波器矩阵
Figure GDA0002791772350000101
进行滤波的输入信号x(n),所述次级路径滤波器矩阵
Figure GDA0002791772350000102
实施于滤波器模块102中,并且输出K×M个滤波输入信号和M个误差信号e(n)。误差信号e(n)由减法器模块105提供,所述减法器模块105从M个期望信号d(n)中减去M个麦克风信号 y'(n)。具有M个麦克风信号y'(n)的M个记录通道是具有利用次级路径滤波器矩阵S(z)进行滤波的K个扬声器信号y(n)的K个输出通道,所述次级路径滤波器矩阵S(z)实施于表示声学场景的滤波器模块104 中。模块和路径应理解为硬件、软件和/或声学路径中的至少一者。
MELMS算法是用于获得最佳最小均方(LMS)解的迭代算法。 MELMS算法的自适应方式允许就地设计滤波器,并且也支持每当电声传递函数发生变化时重新调整滤波器的便利方法。MELMS算法采用最速下降法来搜索性能指数的最小值。这是通过由与梯度
Figure GDA0002791772350000113
的负值成比例的量来连续更新滤波器的系数而达成的,根据其
Figure GDA0002791772350000116
其中μ是控制收敛速度和最终失调的步长。在此类LMS算法中,w近似法可以代替梯度的期望值而使用其瞬时值来更新向量,
Figure GDA0002791772350000115
从而得到LMS算法。
图2是示例性Q×K×M MELMS***或方法的信号流程图,其中Q为1、K为2,并且M为2,且所述MELMS***或方法经过调整在麦克风215处创建明亮区并且在麦克风216处创建黑暗区;即,其出于个别声音区目的而进行调整。“明亮区”表示在其中生成与几乎无声的“黑暗区”相反的声场的区域。输入信号x(n)被供应给四个滤波器模块201-204以及两个滤波器模块205和206,其中,所述四个滤波器模块形成具有传递函数
Figure GDA0002791772350000111
Figure GDA0002791772350000112
的2×2次级路径滤波器矩阵,并且所述两个滤波器模块205和206形成具有传递函数W1(z)和W2(z)的滤波器矩阵。滤波器模块205和206由最小均方(LMS)模块207和208控制,其中模块207接收来自模块201 和202的信号以及误差信号e1(n)和e2(n),并且模块208接收来自模块203和204的信号以及误差信号e1(n)和e2(n)。模块205和206 为扬声器209和210提供信号y1(n)和y2(n)。信号y1(n)通过扬声器 209经由次级路径211和212而分别传播到麦克风215和216。信号 y2(n)通过扬声器210经由次级路径213和214而分别传播到麦克风215和216。麦克风215根据接收信号y1(n)、y2(n)和期望信号d1(n) 生成误差信号e1(n)和e2(n)。具有传递函数
Figure GDA0002791772350000121
Figure GDA0002791772350000122
的模块201-204对具有传递函数S11(z)、S12(z)、S21(z)和S22(z) 的各个次级路径211-214进行建模。
此外,预振铃约束模块217可以将电力或声学期望信号d1(n)供应给麦克风215,所述信号根据输入信号x(n)生成,并且被添加到麦克风215在次级路径211和213的末端处所采集的加总信号,最终导致在此处创建明亮区,而此类期望信号在生成误差信号e2(n)的情形中是缺失的,因此导致在麦克风216处创建黑暗区。与建模延迟(其相位延迟对频率而言是线性的)相比,预振铃约束是基于针对频率而言的非线性相位,以便对人耳的心理声学属性(称为预掩蔽)进行建模。描绘群延迟差异与频率的反指数函数的示例性图表是,并且在图 4中示出作为预掩蔽阈值的相位差异与频率的对应反指数函数。“预掩蔽”阈值在本文中应理解为用于避免均衡滤波器中的预振铃的约束。
如从图3中可见,(图3示出呈限制群延迟函数(群延迟差异与频率)形式的约束),当频率增加时,预掩蔽阈值会降低。当在约100Hz 的频率下,约20ms的群延迟差异所表示的预振铃对于听者而言是可接受的,但是在约1,500Hz的频率下,阈值约为1.5ms,并且可以在约1ms的渐近端值的情况下达到更高频率。图3所示的曲线可以轻易转变成限制相位函数,所述限制相位函数在图4中示为相位差异曲线与频率的关系。通过对限制相位差异函数进行积分,可以导出对应的相位频率特性。然后,这个相位频率特性可以形成具有作为图4所示曲线的积分的相位频率特性的全通滤波器的设计基础。图5中描绘相应设计的全通滤波器的脉冲响应,并且图6中描绘其对应波特图。
现在参看图7,用于使用MELMS算法而在车辆705中生成个别声音区的设置可以包括对应于布置在左前部FLPos、右前部FRPos、左后部RLPos和右后部RRPos的聆听位置(例如,车辆中的座位位置)的四个声音区701-704。在所述设置中,八个***扬声器被布置在距声音区701-704的更遥远处。举例而言,两个扬声器(高音/中音扬声器 FLSpkrH和低音扬声器FLSpkrL)被布置成最接近左前部位置FLPos,并且对应地,高音/中音扬声器FRSpkrH和低音扬声器FRSpkrL被布置成最接近右前部位置FRPos。此外,宽频扬声器SLSpkr和SRSpkr可以分别被布置在对应于位置RLPos和RRPos的声音区的附近。超低音扬声器RLSpkr和RRSpkr可以被安置在车辆内部的后架上,由于超低音扬声器RLSpkr和RRSpkr所生成的低频声音的性质,所述扬声器会影响所有四个聆听位置:左前部FLPos、右前部FRPos、左后部RLPos和右后部RRPos。另外,车辆705可以配备有其它扬声器,所述扬声器被布置成接近例如布置在车辆的头枕中的声音区701-704中。额外扬声器为用于区701的扬声器FLLSpkr和FLRSpkr;用于区702的扬声器 FRLSpkr和FRRSpkr;用于区703的扬声器RLLSpkr和RLRSpkr以及用于区704的扬声器RRLSpkr和RRRSpkr。除了扬声器SLSpkr和扬声器 SRSpkr之外,图7所示设置中的所有其它扬声器都形成各自组(具有一个扬声器的组),其中,扬声器SLSpkr形成一组被动耦接的低音和高音扬声器,并且扬声器SRSpkr形成一组被动耦接的低音和高音扬声器 (具有两个扬声器的组)。可替代地,或者另外地,低音扬声器FLSpkrL 可以与高音/中音扬声器FLSpkrH一起形成一组,并且低音扬声器FRSpkrL可以与高音/中音扬声器FRSpkrH一起形成一组(具有两个扬声器的组)。
图8是相应的图,其说明在使用均衡滤波器、心理声学激发的预振铃约束模块以及***扬声器(即,FLSpkrH、FLSpkrL、FRSpkrH、FRSpkrL、 SLSpkr、SRSpkr、RLSpkr和RRSpkr)的情况下,图7所示设置中的四个区701-704(位置)中的每一个区上的幅度频率响应。图9是振幅时间图(样本中的时间),其说明用于在各自扬声器路径中生成期望串音消除的均衡滤波器的对应脉冲响应。与建模延迟的简单用途相比,使用心理声学激发的预振铃约束提供预振铃的充分衰减。在声学上,预振铃表明在实际声音脉冲发生之前会出现噪音。如从图9中可见,均衡滤波器的滤波器系数且因此均衡滤波器的脉冲响应仅仅展现极小的预振铃。此外,从图8中可见,所有的期望声音区处所得幅度频率响应易于在更高频率下例如在400Hz以上的频率下劣化。
如图10中所示,扬声器1004和1005可以被布置在距听者耳朵 1002的近距离处,例如,下方0.5m或者甚至0.4或0.3m,以便生成期望的个别声音区。一种紧密布置扬声器1004和1005的示例性方式是将扬声器1004和1005整合到听者头部1001可以倚靠在其上的头枕1003中。如图11和图12中所示,另一种示例性方式是将(定向性)扬声器1101和1102安置在顶篷1103中。用于扬声器的其它位置可以是车辆的B柱或C柱,组合头枕或顶篷中的扬声器。作为替代地,或者另外地,可以使用定向扬声器而不使用扬声器1004和1005 或者可以在扬声器1004和1005的相同位置上或不同的另一位置上组合扬声器1004和1005进行组合。
再次参考图7所示的设置,额外扬声器FLLSpkr、FLRSpkr、FRLSpkr、 FRRSpkr、RLLSpkr、RLRSpkr、RRLSpkr和RRRSpkr可被布置在位置FLPos、 FRPos、RLPos和RRPos中的座位的头枕中。如从图13中可见,只有布置在距听者耳朵较近距离上的扬声器诸如额外扬声器FLLSpkr、 FLRSpkr、FRLSpkr、FRRSpkr、RLLSpkr、RLRSpkr、RRLSpkr和RRRSpkr在更高频率下展现改善的幅度频率行为。串音消除是图13中的上部曲线和三条下部曲线之间的差异。然而,由于扬声器与耳朵之间的较短距离(诸如小于0.5m或者甚至小于0.3或0.2m的距离),预振铃是相对较低的,如图14中所示,其中图14说明所有均衡滤波器的滤波器系数且因此脉冲响应,用以在仅仅使用头枕扬声器FLLSpkr、 FLRSpkr、FRLSpkr、FRRSpkr、RLLSpkr、RLRSpkr、RRLSpkr和RRRSpkr并且使用建模延迟(其延迟时间可以对应于滤波器长度的一半)而非预振铃约束时,提供串音消除。在图14中预振铃可以视为主脉冲左侧上的噪音。如15和图16中可见,如果建模延迟在心理声学方面充分缩短,那么将扬声器布置于距听者耳朵的较近距离上已经可以在某些应用中提供充分的预振铃抑制和充分的串音消除。
当将不太遥远的扬声器FLLSpkr、FLRSpkr、FRLSpkr、FRRSpkr、 RLLSpkr、RLRSpkr、RRLSpkr和RRRSpkr与预振铃约束而非建模延迟组合时,预振铃可以进一步降低而不会使更高频率下位置FLPos、FRPos、 RLPos和RRPos处的串音消除(即,位置间幅度差异)劣化。如图17 和图18中可见,使用更遥远扬声器FLSpkrH、FLSpkrL、FRSpkrH、FRSpkrL、 SLSpkr、SRSpkr、RLSpkr和RRSpkr而非不太遥远的扬声器FLLSpkr、 FLRSpkr、FRLSpkr、FRRSpkr、RLLSpkr、RLRSpkr、RRLSpkr和RRRSpkr,并且使用缩短的建模延迟(与上文结合图15和图16所描述的示例中相同的延迟)而非预振铃约束,会展现更差的串音消除。图17为相应的图,其说明仅仅使用安置在距位置FLPos、FRPos、RLPos和RRPos大于0.5m的距离处的扬声器FLSpkrH、FLSpkrL、FRSpkrH、FRSpkrL、 SLSpkr、SRSpkr、RLSpkr和RRSpkr组合均衡滤波器以及与结合图15和图16所描述的示例中相同的建模延迟时,所有四个声音区701-704 处的幅度频率响应。
然而,将布置在头枕中的扬声器FLLSpkr、FLRSpkr、FRLSpkr、 FRRSpkr、RLLSpkr、RLRSpkr、RRLSpkr和RRRSpkr与图7所示设置的更遥远扬声器(即,扬声器FLSpkrH、FLSpkrL、FRSpkrH、FRSpkrL、SLSpkr、 SRSpkr、RLSpkr和RRSpkr)进行组合,并且如图19和图20中所示,使用预振铃约束而非具有减小长度的建模延迟,可以进一步降低(与图 18和图20相比而言)预振铃并且增加(与图17和图19相比而言)位置FLPos、FRPos、RLPos和RRPos处的串音消除。
作为如图3-图5所示的连续曲线的可替代方案,也可以采用阶梯式曲线,其中(例如)步进宽度可以根据心理声学方面(诸如巴尔克 (Bark)尺度或梅尔(Mel)尺度)而选择为频率相关。巴尔克尺度是一种心理声学尺度,其范围是1至24,并且对应于听力的前24个关键频带。其与梅尔尺度相关,但是在某种程度上没有梅尔尺度流行。当在传递函数的幅度频率特性内发生频谱下降或窄带峰值(称为时间扩散)时,巴克尔尺度被听者感知为噪音。因此,均衡滤波器可以在控制操作期间进行平滑,或者滤波器的某些参数(诸如品质因子)可以进行限制,以便减少不想要的噪音。在进行平滑的情况下,可以采用接近人类听力临界频带的非线性平滑。非线性平滑滤波器可以由下述方程式进行描述:
Figure GDA0002791772350000161
其中n=[0、…、N-1]是指平滑信号的离散频率指数;N是指快速傅里叶变换(FFT)的长度;
Figure GDA0002791772350000162
是指向上取整为下一个整数;α是指平滑系数,例如,(八度/3-平滑)得出α=21/3,其中
Figure GDA0002791772350000163
是A(jω) 的平滑值;并且k是非平滑值A(jω)的离散频率指数,k∈[0、…、N-1]。
如从上述方程式中可见,非线性平滑基本上是频率相关算术平均,其频谱极限取决于所选择的非线性平滑系数α与频率而改变。为了将这个原理应用于MELMS算法,对所述算法进行修改,使得根据对数域中的下述方程式分别每一个频仓(FFT的频谱单位)保持针对频率而言的某个最大和最小级阈值:
Figure GDA0002791772350000164
Figure GDA0002791772350000165
其中f=[0、…、fs/2]是长度(N/2+1)的离散频率向量,N是FFT 的长度,fs是取样频率,MaxGaindB是以[dB]为单位的最大有效增加,并且MinGaindB是以[dB]为单位的最小有效降低。
在线性域中,上述方程式改为:
Figure GDA0002791772350000166
Figure GDA0002791772350000167
从上述方程式中,可以导出适用于MELMS算法的幅度约束,以便生成以心理声学上可接受的方式来抑制频谱峰值和下降的非线性平滑式均衡滤波器。图21示出均衡滤波器的示例性幅度频率约束,其中上限U对应于最大有效增加MaxGainLimdB(f)并且下限L对应于最小容许降低MinGainLimdB(f)。图21所示的图描绘对数域中的示例性幅度约束的上限阈值U和下限阈值L,所述示例性幅度约束基于如下参数:fs=5,512Hz、α=21/24、MaxGaindB=9dB和MinGaindB= -18dB。如可见,最大容许增加(例如,MaxGaindB=9dB)和最小容许降低(例如,MinGaindB=-18dB)只有在更低频率下(例如,低于 35Hz的频率下)才会实现。这意味着更低频率具有最大动态特征,其根据非线性平滑系数(例如,α=21/24)而随着频率增加进行降低,其中,根据人耳的频率敏感性,上限阈值U的增加和下限阈值L的降低相对于频率是呈指数级的。
在每一个迭代步骤中,如下述方程式所描述,基于MELMS算法的均衡滤波器经受非线性平滑。
平滑:
ASS(jω0)=|A(jω0)|、
Figure GDA0002791772350000171
Figure GDA0002791772350000172
双边带频谱:
Figure GDA0002791772350000173
其中
Figure GDA0002791772350000184
复合频谱:
Figure GDA0002791772350000182
快速傅里叶逆变换(IFFT)的脉冲响应:
Figure GDA0002791772350000183
图22中示出相应修改的MELMS算法的流程图,所述MELMS 算法是基于上文结合图2所描述的***和方法。幅度约束模块2201 被布置在LMS模块207与均衡滤波器模块205之间。另一幅度约束模块2202被布置在LMS模块208与均衡滤波器模块206之间。幅度约束可以与预振铃约束结合使用(如图22中所示),但是也可以与其它心理声学激发的约束相结合或者与建模延迟相结合而用于独立应用中。
然而,当组合幅度约束与预振铃约束时,与不具有幅度约束的***和方法(如图24所示的对应所得波特图所示出)相比,可以实现通过图23所示的波特图(幅度频率响应、相位频率响应)而示出的改进。清楚的是,只有具有幅度约束的***和方法的幅度频率响应经受非线性平滑,而相位频率响应基本上不会改动。此外,从图25中可见(与图8相比而言),具有幅度约束和预振铃约束的***和方法不会对串音消除性能造成负面影响,但是,如图26所示(与图9相比而言),后振铃可能会恶化。在声学方面,后振铃表明在发生实际声音脉冲之后出现噪音,并且在图26中可以看作是主脉冲右侧的噪音。
一种用于平滑均衡滤波器的频谱特性的可替代方式可以是直接在时域中对均衡滤波器系数开窗。在开窗的情况下,无法根据心理声学标准而在与上述***和方法中相同的程度上来控制平滑,但是均衡滤波器系数的开窗操作允许更大程度地在时域中控制滤波器行为。图 27为相应的图,其说明当使用均衡滤波器和仅仅更遥远扬声器即,扬声器FLSpkrH、FLSpkrL、FRSpkrH、FRSpkrL、SLSpkr、SRSpkr、RLSpkr和 RRSpkr)组合基于利用0.75高斯窗进行的开窗的预振铃约束和幅度约束时,声音区701-704上的幅度频率响应。图28中描绘所有均衡滤波器的对应脉冲响应。
如果开窗是基于可参数化高斯窗,那么下述方程式适用:
Figure GDA0002791772350000191
其中
Figure GDA0002791772350000192
并且α是与标准偏差σ间接成比例的参数且为 (例如)0.75。参数α可以看作是具有高斯形状(振幅与样本中的时间) 的平滑参数,如图29所示。
图30所示的所得***和方法的信号流程图是基于上文结合图2 所描述的***和方法。开窗模块3001(幅度约束)被布置在LMS模块 207与均衡滤波器模块205之间。另一开窗模块3002被布置在LMS 模块208与均衡滤波器模块206之间。开窗可以与预振铃约束(如图 22中所示)结合使用,但是也可以与其它心理声学激发的约束相结合或者与建模延迟相结合而用于独立应用中。
如图27中可见,开窗不会造成串音消除性能的显著变化,但是,正如从图26和图28的比较中可见,均衡滤波器的时间行为得到改善。然而,如比较图31与图23和图24时所显而易见,使用窗口作为幅度约束不会像另一版本一样导致幅度频率曲线的巨大平滑。相反,如也在比较图31与图23和图24时所显而易见,因为在时域中执行平滑,所以相位时间特性得以平滑。图31是当使用仅仅更遥远扬声器组合基于利用修改高斯窗的开窗的预振铃约束和幅度约束时***或方法的波特图(幅度频率响应、相位频率响应)。
因为开窗是在将约束应用于MELMS算法中之后执行,所以窗口 (例如,图29中所示的窗口)会周期性地进行移位和修改,这可以表示如下:
Figure GDA0002791772350000201
图29中所示的高斯窗往往在参数α变得更小时达到平衡,且因此在参数α的更小数值下提供更少的平滑。参数α可以取决于不同方面而进行选择,诸如更新速率(即,开窗在某些数量的迭代步骤内多久应用一次)、迭代总数等。在当前示例中,开窗是在每一个迭代步骤中加以执行,这便是选择相对较小参数α的原因,因为滤波器系数与窗口的重复相乘是在每一个迭代步骤中执行的,并且滤波器系数连续降低。图32中示出相应修改的窗口。
开窗不仅允许在幅度和相位方面在频谱域中进行某个平滑,而且还允许调整均衡滤波器系数的期望时间限定。这些效果可以通过平滑参数诸如可配置窗口(参见上述示例性高斯窗中的参数α),而自由地进行选择,使得可以调整时域中均衡滤波器的最大衰减和声学品质。
又一种用于平滑均衡滤波器的频谱特性的可替代方式可以是,除幅度之外,还在幅度约束内提供相位。代替应用未处理的相位,应用之前经过恰当平滑的相位,其中平滑可以再次为非线性的。然而,任何其它平滑特性也是适用的。平滑可以只应用于作为连续相位频率特性的解缠相位,而不应用于处于–π≤φ<π的有效范围内的(重复)缠绕相位。
为了同时考虑拓扑结构,可以采用空间约束,其可以通过按照如下方式调适MELMS算法而实现:
Figure GDA0002791772350000211
其中
E′m(e,n)=Em(e,n)Gm(e)和Gm(e)是用于频谱域中第m个误差信号的加权函数。
图33中示出相应修改的MELMS算法的流程图,所述算法是基于上文结合图22所描述的***和方法,且其中空间约束LMS模块 3301替换LMS模块207,并且空间约束LMS模块3302替换LMS 模块208。空间约束可以与预振铃约束结合使用(如图33中所示),但是也可以与心理声学激发的约束相结合或者与建模延迟相结合而用于独立应用中。
图34中示出以可替代方式修改的MELMS算法的流程图,所述算法也是基于上文结合图22所描述的***和方法。布置空间约束模块3403来控制增益控制滤波器模块3401和增益控制滤波器模块 3402。增益控制滤波器模块3401被布置在麦克风215的下游,并且提供修改后的误差信号e'1(n)。增益控制滤波器模块3402被布置在麦克风216的下游,并且提供修改后的误差信号e'2(n)。
在图34所示的***和方法中,来自麦克风215和216的(误差) 信号e1(n)和e2(n)是在时域中而非频谱域中进行修改。不过,可以执行时域中的修改,使得也会(例如)通过提供频率相关增益的滤波器来修改信号的频谱构成。然而,增益也可以仅仅是频率相关的。
在图34所示的示例中,并不应用空间约束,即,所有误差麦克风(所有位置、所有声音区)进行同等加权,使得不会着重强调或无视特定麦克风(位置、声音区)。然而,也可以应用位置相关加权。可替代地,可以界定子区域,使得(例如)听者耳朵周围的区域可以进行放大,而头部的后部上的区域可以进行阻抑。
可能合乎需要的是,修改供应给扬声器的信号的频谱应用场,因为扬声器可以展现不同的电力特性和声学特性。但是,即使所有特性都是相同的,也可能合乎需要的是,独立于其它扬声器来控制每一个扬声器的带宽,因为,当安置在不同位点(位置,具有不同音量的开口箱)上时,具有相同特性的相同扬声器可用带宽可以是不同的。此类差异可以通过分频滤波器来补偿。在图35所示的示例性***和方法中,可以使用频率相关增益约束(本文中也称为频率约束),而不使用分频滤波器,以便确保所有扬声器在相同或者至少类似的方式下进行操作,(例如)使得没有任何扬声器是过载的,过载会导致不想要的非线性失真。频率约束可以用多种方式实现,下文将论述其中的两种方式。
图35中示出相应修改的MELMS算法的流程图,所述算法是基于上文结合图34所描述的***和方法,但是也可以基于本文中所描述的具有或不具有特定约束的任何其它***和方法。在图35所示的示例性***中,LMS模块207和208由频率相关增益约束LMS模块 3501和3502替换,以提供可描述为如下的特定调适行为:
Figure GDA0002791772350000221
其中k=1,...,K,K是扬声器的数量;m=1,...,M,M是麦克风的数量;
Figure GDA0002791772350000222
是时间n(样本中)处第k个扬声器与第m个误差) 麦克风之间的次要路径的模型;且|Fk(e)|是分频滤波器对供应给第 k个扬声器的信号的频谱限制的幅度,所述信号在整个时间n上基本是恒定的。
如可见,修改MELMS算法基本上只是用以生成滤波输入信号的修改,其中滤波输入信号在频谱方面通过K个分频滤波器模块而利用传递函数加以限制Fk(e)。分频滤波器模块可以具有复杂传递函数,但是在某些应用中,足以仅使用传递函数的幅度,|Fk(e)|以便实现期望的频谱限制,因为频谱限制无需相位且所述相位可能甚至干扰调适过程。图36中描绘适用分频滤波器的示例性频率特性的幅度。
图37和图38分别示出所有四个位置处的对应幅度频率响应,以及均衡滤波器的滤波器系数(表示其脉冲响应)与(样本中)时间的关系。图37中所示的幅度响应以及图38中所示用以建立串音消除的均衡滤波器的脉冲响应涉及当结合仅仅更遥远扬声器(诸如图7所示设置中的扬声器FLSpkrH、FLSpkrL、FRSpkrH、FRSpkrL、SLSpkr、SRSpkr、 RLSpkr和RRSpkr)应用均衡滤波器且组合频率约束、预振铃约束和幅度约束(包括利用0.25高斯窗的开窗)时的四个位置。
图37和图38说明通过分频滤波器模块在低于400Hz下对输出信号进行频谱限制的结果,如从图38和图27的比较中可见,所述频谱限制对图7所示设置中的前部低音扬声器FLSpkrL和FRSpkrL生成微小影响,并且不会对串音消除生成任何显著影响。当比较图39和图31中所示的波特图时,这些结果也会受到支持,其中,图39中所示的图基于形成图37和图38的基础的相同设置,并且示出低音扬声器FLSpkrL和FRSpkrL处于前部位置FLPos和FRPos的附近时供应给它们的信号的显著变化。如上文所阐述具有频率约束的***和方法可在一些应用中在低频率下展现某个缺点(幅度下降)。因此,可可替代地实施频率约束,例如,下文结合图40所论述的方式。
如图40中所示的相应修改的MELMS算法的流程图是基于上文结合图34所描述的***和方法,但是也可可替代地基于本文中所描述具有或不具有特定约束的任何其它***和方法。在图40所示的示例性***中,频率约束模块4001可以被布置在均衡滤波器205的下游,并且频率约束模块4002可以被布置在均衡滤波器206的下游。频率约束的可替代布置允许通过对供应给扬声器的信号进行预滤波而减小分频滤波器对房间传递特性的复合影响(幅度和相位), Sk,m(e,n)即实际发生的传递函数,
Figure GDA0002791772350000232
以及图40中由
Figure GDA0002791772350000233
指示的其模型的传递函数
Figure GDA0002791772350000231
对MELMS算法的这个修改可以利用下述方程式进行描述:
S'k,m(e,n)=Sk,m(e,n)Fk(e),
Figure GDA0002791772350000241
其中
Figure GDA0002791772350000242
是的近似值S′k,m(e,n)。
图41为相应的图,其说明当应用均衡滤波器并且仅仅更遥远扬声器(即,图7所示设置中的FLSpkrH、FLSpkrL、FRSpkrH、FRSpkrL、 SLSpkr、SRSpkr、RLSpkr和RRSpkr)与预振铃约束、幅度约束(利用0.25 高斯窗进行的开窗操作)以及包括在房间传递函数中的频率约束结合使用时,上文结合图7所描述的四个位置处的幅度频率响应。图42 中示出对应脉冲响应,并且图43中示出对应波特图。如图41-43中可见,分频滤波器对处于前部位置FLPos和FRPos附近的低音扬声器 FLSpkrL和FRSpkrL具有显著影响。特别地,当比较图41和图37时,可见图41的图所基于的频率约束允许在更低频率下生成更为明显的滤波效果,并且,串音消除性能在高于50Hz的频率下会稍许地劣化。
取决于应用,至少一个(其它)心理声学激发的约束可以单独地进行使用,或者与其它心理声学激发的约束或不是心理声学激发的约束(如扬声器至房间至麦克风的约束)组合使用。举例而言,仅仅使用幅度约束时均衡滤波器的时间行为,即,保持原始相位时幅度频率特性的非线性平滑(对比图26中所描绘的脉冲响应)会被听者感受为恼人的音调后振铃。这个后振铃可以通过后振铃约束进行抑制,所述后振铃约束可以基于能量时间曲线(ETC)而按照如下方式进行描述:
补零:
Figure GDA0002791772350000251
其中
Figure GDA0002791772350000257
是MELMS算法中用于第k个均衡滤波器且长度为N/2 的最终滤波器系数集,并且0是长度为N的零列向量。
FFT转换:
Figure GDA0002791772350000252
ETC计算:
Figure GDA0002791772350000253
Figure GDA0002791772350000254
Figure GDA0002791772350000255
Figure GDA0002791772350000256
其中Wk,t(e)是第t个迭代步骤(矩形窗)处的第k个均衡滤波器的频谱的实部,且
Figure GDA0002791772350000258
表示第k个均衡滤波器的瀑布图,其包括对数域中长度为N/2的单边带频谱的所有N/2个幅度频率响应。
当计算典型车辆的房间脉冲响应的ETC,并且将所得ETC与供应给上述MELMS***或方法中左前高频扬声器FLSpkrH的信号的 ETC进行比较时,结果便是,某些频率范围中所展现的衰退时间明显更长,这可以看作是后振铃的根本原因。此外,结果是上述MELMS ***和方法的房间脉冲响应中所包含的能量在衰退过程中的稍晚时间上可能是过多的。与如何抑制预振铃的方式类似,后振铃可以通过后振铃约束进行抑制,所述后振铃约束基于人耳的心理声学属性(称为(听觉)后掩蔽)。
当声音的感受由于另一声音的存在而受到影响时,便会发生听觉掩蔽。频域中的听觉掩蔽称为同时掩蔽、频率掩蔽或频谱掩蔽。时域中的听觉掩蔽称为时间掩蔽或非同时掩蔽。无掩蔽阈值是可以在没有目前掩蔽信号的情况下感受到的信号的最安静级别。掩蔽阈值是与特定掩蔽噪音组合时所感受到的信号的最安静级别。掩蔽量是掩蔽阈值和无掩蔽阈值之间的差异。掩蔽量将取决于目标信号和掩蔽信号的特性而发生改变,并且也将专用于个别听者。当由于与原始声音具有相同持续时间的噪音或不想要的声音而使得声音不可听见时,便会发生同时掩蔽。当突然的刺激声音使得刚在刺激声音之前或之后出现的其它声音不可听见时,时间掩蔽或非同时掩蔽便会发生。遮掩刚在掩蔽信号之前的声音的掩蔽称为向后掩蔽或预掩蔽,并且遮掩刚在掩蔽信号之后的声音的掩蔽称为向前掩蔽或后掩蔽。如图44中所示,时间掩蔽的有效性从掩蔽信号的开始和结束以指数形式衰减,其中开始衰减持续约20ms,并且结束衰减持续约100ms。
图45中示出描绘群延迟差异与频率的反指数函数的示例性图表,并且图46中示出相位差异与频率的对应反指数函数(表示后掩蔽阈值)。“后掩蔽”阈值在本文中应理解为用于避免均衡滤波器中的后振铃的约束。如从图45中可见(图45示出呈限制群延迟函数(群延迟差异与频率)形式的约束),当频率增加时,后掩蔽阈值便会降低。虽然在大约1Hz的频率下,持续时间大约为250ms的后振铃对于听者而言可能是可接受的,但是在大约500Hz的频率下,阈值已经处于大约50ms上,并且在大约5ms的渐近结束值的情况下可能达到更高频率。图45中所示的曲线可以轻易地变换成限制相位函数,所述限制相位函数在图46中示出为相位差异曲线与频率的关系。因为后振铃(图45和图46)和预振铃(图3和图4)的曲线的形状十分相似,所以相同的曲线可以用于后振铃和预振铃,但是具有不同的标度。后振铃约束可以按照如下方式进行描述:
具体参数说明:
Figure GDA0002791772350000271
是(样本中)长度为N/2的时间向量,
t0=0是时间的开始点,
a0db=0dB是开始级别,并且
a1db=-60dB是结束级别。
梯度:
Figure GDA0002791772350000272
是限制函数的梯度(以dB/s为单位);
τ群延迟(n)是用于抑制(FFT频仓中)频率n下的后振铃(以s为单位)的群延迟的差异函数。
限制函数:
LimFctdB(n,t)=m(n)tS是用于第n个频仓的时间限制函数(以dB 为单位),并且
Figure GDA0002791772350000273
是表示(FFT频仓中)单边带频谱的频仓数目的频率指数。
时间补偿/定标:
[ETCdBk(n)Max,tMax]=max{ETCdBk(n,t)},
Figure GDA0002791772350000281
0是具有长度tMax的零向量,并且
tMax是其中第n个限制函数具有其最大值的时间指数。
线性化:
Figure GDA0002791772350000282
ETC的限制:
Figure GDA0002791772350000283
房间脉冲响应的计算:
Figure GDA0002791772350000284
是包括后振铃约束的第k个通道(供应给扬声器的信号)的修改后房间脉冲响应。
如以上方程式可见,后振铃约束在此处是基于ETC的时间限制,所述时间限制是频率相关的,并且其频率相关性是基于群延迟差异函数τ群延迟(n)。图45中示出在给定时间段内τ群延迟(n)表示群延迟差异函数的示例性曲线,τ群延迟(n)fS限制函数的级别应根据图47所示的LimFctdB(n,t)阈值a0dB和a1db降低。
对于每一个频率n而言,时间限制函数(诸如图47中所示的时间限制函数)会被计算并且应用于ETC矩阵。如果对应ETC时间向量的值超过频率n下给定的对应阈值,LimFctdB(n,t)那么ETC时间向量便会根据其距阈值的距离而进行定标。以此方式,确保均衡滤波器在其频谱上展现群延迟差异函数所需要的频率相关时间下降τ群延迟(n)。由于群延迟差异函数τ群延迟(n)是根据心理声学要求而设计的(参见图44),对于听者而言是恼人的后振铃可以避免或者-少减小到可接受的程度。
现在参看图48,后振铃约束可以(例如)在上文结合图40所描述的***或方法中(或者在本文所描述的任何其它***和方法中)实施。在图48所示的示例性***中,使用组合式幅度和后振铃约束模块4801和4802而非幅度约束模块2201和2202。图49为相应的图,其说明当应用均衡滤波器并且仅仅更遥远扬声器(即,图7所示设置中的FLSpkrH、FLSpkrL、FRSpkrH、FRSpkrL、SLSpkr、SRSpkr、RLSpkr和RRSpkr) 与预振铃约束、幅度约束(利用0.25高斯窗进行的开窗操作)以及包括在房间传递函数中的频率约束结合使用时,上文结合图7所描述的四个位置处的幅度频率响应。
图50中展示对应脉冲响应,并且图51中展示对应波特图。当将图49所示的图与图41所示的图比较时,可见后振铃约束会稍微使串音消除性能出现劣化。另一方面,图50所示的图展示出后振铃比图 42所示的图中的后振铃更小,图42所示的图涉及到图40所示的***和方法。如从图51所示的波特图显而易见,后振铃约束对相位特性具有一些作用,例如,相位曲线会被平滑。
另一种用于实施后振铃约束的方式是将其整合于上文结合开窗幅度约束所描述的开窗程序中。如前文所述,时域中的后振铃约束在频谱上是以与开窗幅度约束相类似的方式进行开窗的,使得这两种约束可以合并成一个约束。为了实现这一点,每一个均衡滤波器专门在迭代过程结束时进行滤波,其开始于具有类似于FFT分析的等距频率点的一组余弦信号。之后,利用频率相关窗口函数对相应计算的时间信号进行加权。窗口函数可以随着增加的频率而缩短,使得针对更高频率来增强滤波,并且因此建立非线性平滑。再次地,类似于图 45中所描绘的群延迟差异函数,可以使用以指数方式倾斜且其时间结构由群延迟决定的窗口函数。
所实施的窗口函数(其可自由地参数化并且其长度是频率相关的),可以是指数函数、线性函数、汉明(Hamming)函数、汉宁 (Hanning)函数、高斯函数或任何其它合适类型的函数。出于简洁性原因,目前示例中所使用的窗口函数是指数类型的。限制函数的结束点a1dB可以是频率相关的(例如,频率相关限制函数a1dB(n),其中a1dB(n) 可以在n增加时降低),以便改善串音消除性能。
开窗函数还可以被配置使得在由群延迟函数定义的时间段内,τ群延迟(n)级别会下降到频率相关结束点a1dB(n)所指定的数值,所述数值可以通过余弦函数修改。所有相应开窗余弦信号随后被加总,并且总和会被定标,以提供均衡滤波器的脉冲响应,所述脉冲响应的幅度频率特性看上去是被平滑的(幅度约束),并且其衰退行为会根据预定群延迟差异函数进行修改(后振铃约束)。由于开窗是在时域中执行的,所以其不仅影响幅度频率特性,而且影响相位频率特性,使得实现频率相关非线性复合平滑。开窗技术可以通过下文所阐述的方程式进行描述。
具体参数说明:
Figure GDA0002791772350000301
是(样本中)长度为N/2的时间向量,
t0=0是时间的开始点,
a0db=0dB是开始级别,并且
a1db=-120dB是较低阈值.
级别限制:
Figure GDA0002791772350000302
是级别限制,
Figure GDA0002791772350000311
是级别修改函数,
a1dB(n)=LimLevdB(n)LevModFctdB(n),其中
Figure GDA0002791772350000312
是表示单边带频谱的频仓数目的频率指数。
余弦信号矩阵:
CosMat(n,t)=cos(2πntS)是余弦信号矩阵。
窗口函数矩阵:
Figure GDA0002791772350000313
是限制函数的梯度(以dB/s为单位),
τ群延迟(n)是用以抑制第n个频仓上的后振铃的群延迟差异函数,
LimFctdB(n,t)=m(n)tS是用于抑制第n个频仓上的后振铃的群延迟差异函数,
Figure GDA0002791772350000314
是包括所有频率相关窗口函数的矩阵。
滤波(应用):
Figure GDA0002791772350000315
是余弦矩阵滤波器,其中wk是长度为N/2的第k个均衡滤波器。
开窗和定标(应用):
Figure GDA0002791772350000321
WinMat(n,t)是借助前文所述的方法而导出的第k个通道的平滑均衡滤波器。
图52中描绘示例性频率相关级别限制函数a1dB(n)和LimLevdB(n) 示例性级别限制的幅度时间曲线。级别限制函数a1dB(n)已经根据在图 53中示出为幅度频率曲线的级别修改函数LevModFctdB(n)而修正成下限频率比上限频率受到更小限制的效果。图54中在频率200Hz(a)、 2,000Hz(b)和20,000Hz(c)下示出基于指数窗的开窗函数 WinMat(n,t)。因此,如在图55-57中可进一步可见,幅度约束和后振铃约束可以彼此组合,而不会出现任何显著的性能下降。
图55为相应的图,其说明当应用均衡滤波器并且仅仅更遥远扬声器(即,图7所示设置中的FLSpkrH、FLSpkrL、FRSpkrH、FRSpkrL、 SLSpkr、SRSpkr、RLSpkr和RRSpkr)与预振铃约束、频率约束、开窗幅度和后振铃约束结合使用时,上文结合图7所描述的四个位置处的幅度频率响应。图56中展示对应脉冲响应(振幅时间图),并且图57 中展示对应波特图。前文所述的开窗技术允许在更高频率下显著地减少频谱成分,这会被听者更为便捷地感受到。应注意,这种特殊的开窗技术不仅适用于MIMO***中,而且也可以应用于使用约束的任何其它***和方法,诸如一般的均衡***或测量***。
在多数前述示例中,仅使用图7所示设置中的更遥远扬声器即 FLSpkrH、FLSpkrL、FRSpkrH、FRSpkrL、SLSpkr、SRSpkr、RLSpkr和RRSpkr。然而,采用更接近布置扬声器诸如扬声器FLLSpkr、FLRSpkr、FRLSpkr、 FRRSpkr、RLLSpkr、RLRSpkr、RRLSpkr和RRRSpkr可提供额外性能改善。因此,在图7所示的设置中,鉴于串音消除性能,所有扬声器包括安置在头枕中的八个扬声器均用来评定开窗后振铃约束的性能。假定在左前部位置上建立明亮区,并且在其余三个位置上生成三个黑暗区。
图58通过幅度频率曲线来说明目标函数,所述目标函数是针对明亮区中的调性的参考,并且可以同时应用于预振铃约束。在图59 中将基于图58所示的目标函数且在具有与没有所应用的开窗(开窗后振铃约束)的情况下的示例性均衡滤波器的脉冲响应描绘为线性域中的振幅时间曲线,并且在图60中将其描绘为对数域中的幅度时间曲线。从图60中显而易见的是开窗后振铃约束能够显著地减少基于 MELMS算法的均衡滤波器的均衡滤波器系数且因而脉冲响应的衰退时间。
从图60中可见,衰退是根据心理声学要求的,这意味着时间减少的有效性会在频率增加时连续增加,而且不会使串音消除性能劣化。此外,图61证明几乎完美地满足图58中所示出的目标函数。图 61为相应的图,其说明将图7所示设置中的所有扬声器(包括头枕中的扬声器)和均衡滤波器组合预振铃约束、频率约束、窗口化幅度以及开窗后振铃约束使用时,上文结合图7所描述的四个位置处的幅度频率响应。图62中示出对应脉冲响应。一般而言,所有类型的心理声学约束(如预振铃约束、幅度约束、后振铃约束)和所有类型的扬声器-房间-麦克风约束(如频率约束和空间约束)可以按要求组合。
参看图63,上文结合图1所描述的***和方法可以进行修改,以便不仅生成单独的声音区,而且生成任何期望的波场(称为可听化)。为了实现这一点,图1所示的***和方法已经针对主要路径101 进行修改,其中所述主要路径101已经由可控制主要路径6301代替。主要路径6301会根据源房间6302(例如,期望听音室)进行控制。次级路径可以实施为目标房间,诸如车辆的内部6303。图63中所示的示例性***和方法是基于相应的简单设置,其中,在具有与图7所示设置相同的设置的一个特定实际聆听位置(例如,车辆内部6303中的左前部位置)周围的声音区内建立(建模)期望听音室6302(例如,音乐厅)的声学效果。聆听位置可以是听者耳朵的位置、听者两个耳朵之间的点,或者是目标房间6303中头部周围某个位置上的区域。
源房间和目标房间中的声学测量可以利用相同麦克风群集(即,具有相同声学属性并且相对于彼此安置在相同位置上的相同数目麦克风)来进行。在MELMS算法生成具有传递函数W(z)的K个均衡滤波器的系数时,相同声学条件可如在源房间中的对应位置处那样呈现在目标房间中的麦克风位置处。在本示例中,这意味着,虚拟中心扩音器可以建立在目标房间6303的左前部位置上,所述目标房间6303 具有与源房间6302所测出的属性相同的属性。因此,如在图64所示的设置中可以见,上文所述的***和方法也可以用于生成若干个虚拟源。应注意,左前部扬声器FL和右前部扬声器FR分别对应于具有高频扬声器FLSpkrH和FRSpkrH以及低频扬声器FLSpkrL和FRSpkrL 的扬声器阵列。在本示例中,源房间6401和目标房间6303两者可以是5.1音频设置。
然而,不仅单个虚拟源可以在目标房间中进行建模,而且多个(I 个)虚拟源可以同时建模,其中,对于I个虚拟源中的每一个虚拟源而言,计算对应均衡滤波器系数集Wi(z),I为0、…、I-1。举例而言,当在左前部位置上对虚拟5.1***建模时(如图64中所示),会生成根据5.1***的ITU标准进行安置的I=6个虚拟源。用于具有多个虚拟源的***的方法类似于用于只具有一个虚拟源的***的方法,那就是,I个主要路径矩阵Pi(z)在源房间中进行确定,并且被应用于目标房间中所设置的扬声器。随后,用于K个均衡滤波器的均衡滤波器系数集Wi(z)通过修改MELMS算法而针对每一个矩阵Pi(z)以自适应方式进行确定。然后,如图65中所示,I×K个均衡滤波器被叠加和应用。
图65是相应生成的I×K个均衡滤波器的应用的流程图,所述I ×K个均衡滤波器形成I个滤波器矩阵6501-6506,以在驾驶员的位置上根据5.1标准来提供I=6个虚拟声源而用于近似声音再生。根据 5.1标准,与扬声器位置C、FL、FR、SL、SR和Sub相关的六个输入信号供应给六个滤波器矩阵6501-6506。均衡滤波器矩阵6501-6506 提供I=6个均衡滤波器系数集W1(z)-W6(z),其中每一个集包括K个均衡滤波器,并且因此提供K个输出信号。滤波器矩阵的对应输出信号通过加法器6507-6521加总,且然后供应给布置在目标房间6303 中的各自扬声器。举例而言,k=1时的输出信号被加总并供应给右前部扬声器(阵列)6523,k=2时的输出信号被加总并供应给左前部扬声器(阵列)6522,k=6时的输出信号被加总并供应给超低音扬声器6524,等等。
波场可以在任何数目的位置上建立,例如,如图66中所示,目标房间6601中的四个位置上的麦克风阵列6603-6606。提供4×M的麦克风阵列会在求和模块6602中进行加总,以向减法器105提供M 个信号y(n)。修改MELMS算法不仅允许控制虚拟声源的位置,而且允许控制水平入射角度(方位)、垂直入射角度(标高)以及虚拟声源和听者之间的距离。
此外,场可以被编码成其本征模,即球形谐波,所述本征模随后再次被解码以提供与原始波场相同或至少极为相似的场。在解码期间,波场可以动态修改,例如旋转、放大或缩小、扭结、拉伸、前后移位,等等。通过将源房间中的源的波场编码成其本征模式,并且在目标房间中通过MIMO***或方法对本征模进行编码,虚拟声源因而可以针对其在目标房间中的三维位置进行动态修改。图67描绘M= 4的阶数的示例性本征模。这些本征模(例如,具有图67所示的频率相关形状的波场)可以通过特定均衡滤波器系数集而建模到某好程度(阶数)。阶数基本上取决于目标房间中所存在的声音***,诸如声音***的上限截止频率。截止频率越高,阶数应越高。
对于目标房间中距听者更遥远并且因而展现fLim=400…600 Hz的截止频率的扬声器而言,足够的阶数是M=1,这是三维中的前 N=(M+1)2=4个球形谐波和二维中的前N=(2M+1)=3个球形谐波。
Figure GDA0002791772350000351
其中,c是声音的速度(20℃下为343m/s),M是本征模的阶数,N是本征模的数目,并且R是区的聆听表面的半径。
相比之下,当额外扬声器被安置成更接近听者(例如,头枕扬声器)时,阶数M可以取决于最大截止频率而增加到M=2或M=3。假定遥远场条件占主导,即,波场可以***为平面波,那么波场可以通过傅里叶贝塞尔(Fourier Bessel)级数描述如下:
Figure GDA0002791772350000361
其中
Figure GDA0002791772350000363
是用于抑制第N个频仓上的后振铃的群延迟差异函数,
Figure GDA0002791772350000364
是第m阶、第n级的复合球谐函数(实部σ=1,虚部σ=-1), P(r,ω)是位置
Figure GDA0002791772350000362
处的声压的频谱,S(jω)是频谱域中的输入信号,j是复数的虚数单位,并且jm(kr)是第m阶数的第一类球形贝塞尔函数。
如图68中所描绘,复合球谐函数
Figure GDA0002791772350000365
然后可以在目标房间中通过MIMO***和方法(即,通过对应均衡滤波器系数)进行建模。相比之下,环境立体声学系数
Figure GDA0002791772350000366
是从源房间或房间模拟中的波场的分析中导出的。图68是相关应用的流程图,其中,在目标房间中通过MIMO***或方法生成前N=3个球形谐波。三个均衡滤波器矩阵 6801-6803提供虚拟声源的前三个球形谐波(W,X和Y),以根据输入信号x[n]而在驾驶员位置上进行近似声音再生。均衡滤波器矩阵 6801-6803提供三个均衡滤波器系数集W1(z)-W3(z),其中每一个集包括K个均衡滤波器并且因此提供K个输出信号。滤波器矩阵的对应输出信号通过加法器6804-6809进行加总,且然后供应给布置在目标房间6814中的各自扬声器。举例而言,k=1时的输出信号被加总并供应给右前部扬声器(阵列)6811,k=2时的输出信号被加总并供应给左前部扬声器(阵列)6810,并且k=K时的最后输出信号被加总并供应给超低音扬声器6812。然后,在聆听位置6813上,生成一起形成一个虚拟源的期望波场的前三个本征模X、Y和Z。
如从下述示例中可见,可以简单方式做出修改,其中在解码时引入旋转元素:
Figure GDA0002791772350000371
其中
Figure GDA0002791772350000373
是在期望方向上转动球形谐波的模态加权系数
Figure GDA0002791772350000372
参看图69,用于测量源房间的声学效果的布置可以包括麦克风阵列6901,其中多个麦克风6903-6906被安置在头带6902上。头带 6902可以由听者6907在处于源房间中时进行佩戴,并且被定位成略高于听者耳朵。可以使用麦克风阵列,而不是单个麦克风来测量源房间的声学效果。麦克风阵列包括至少两个麦克风,所述两个麦克风被布置在具有与普通听者头部的直径相对应直径的圆圈上,并且被布置在对应于普通听者耳朵的位置中。阵列的麦克风中的两个麦克风可以被安置在普通听者耳朵的位置处,或者被至少安置成接近于普通听者耳朵位置。
也可以使用具有与人类头部相似属性的任何人造头部或刚球,而不使用听者头部。此外,额外麦克风可以被布置在所述圆圈以外的位置中(例如,其它圆圈上),或者根据任何其它样式而被布置在刚球上。图70描绘包括处于刚球7002上的多个麦克风7002的麦克风阵列,其中一些麦克风7001可以被布置在至少一个圆圈7003上。圆圈 7003可以经布置使得其对应于包括听者耳朵位置的圆圈。
可替代地,多个麦克风可以被布置在包括耳朵位置的多个圆圈上,但是所述多个麦克风集中到周围存在有人耳或者在人造头部或其它刚球情形中可能会存在有人耳的区域。图71中示出相应布置的示例,在所述布置中,麦克风7102被布置在听者7101所佩戴的耳机 7103上。麦克风7102可以按照规则样式而安置在人耳位置周围的半球上。
用以测量源房间中声学效果的其它可替代麦克风布置,可以包括耳朵位置上具有两个麦克风的人造头部、以平面样式布置的麦克风或者以(准)规则型式放置在刚球上的麦克风,这些能够直接测量环绕声系数。
再次参看上文结合图52-54所做的描述,如图72所示用以向幅度约束提供整合后振铃约束的示例性过程可以包括:以迭代方式调适滤波器模块的传递函数(7201);调适后将一组具有等距频率和相等振幅的余弦信号输入到滤波器模块中(7202);利用频率相关开窗函数对滤波器模块所输出的信号加权(7203);加总被滤波、开窗的余弦信号以提供和信号(7204);以及对所述和信号进行定标以提供滤波器模块的更新脉冲响应,以控制K个均衡滤波器的传递函数 (7205)。
应了解,在上文所述的***和方法中,滤波器模块和滤波器控制模块两者可实施于车辆内,但是可替代地,只有滤波器模块可以实施于车辆内,而滤波器控制模块可以在车辆外部。作为另一可替代方案,滤波器模块和滤波器控制模块两者可以实施于车辆外(例如,计算机中),并且滤波器模块的滤波器系数可以被复制到安置于车辆中的阴影滤波器中。此外,调适可根据具体情况为一次性过程或者连贯过程。
虽然已经描述本发明的各种实施方案,但是对于本领域普通技术人员显而易见的是,在本发明的范围内的很多实施方案及实施是可行的。因此,除了按照随附权利要求及其等效物之外,本发明不受限制。

Claims (12)

1.一种被配置来在目标扬声器-房间-麦克风***中的聆听位置周围生成声波场的***,其中,K≥1组扬声器的扬声器阵列被安置在所述聆听位置周围,其中每一组扬声器具有至少一个扬声器,而M≥2组麦克风的麦克风阵列被安置在所述聆听位置处,其中每一组麦克风具有至少一个麦克风,所述***包括:
K个均衡滤波器模块,其被布置在所述扬声器的组的信号路径上游和输入信号路径的下游中,并且具有可控制传递函数,以及
K个滤波器控制模块,其被布置在所述麦克风的组的信号路径下游和所述输入信号路径的下游中,并且基于来自所述M组麦克风的误差信号和所述输入信号路径上的输入信号根据自适应控制算法来控制所述K个均衡滤波器模块的所述可控制传递函数,其中
所述麦克风阵列包括至少两个第一组麦克风,其环状安置在听者的头部周围,人工头部周围或人工头部中,或者刚球周围或刚球中;
M个主要路径建模模块,被布置在麦克风的所述组的信号路径上游和所述输入信号路径的下游,所述主要路径建模模块被配置来对呈现在期望源扬声器-房间-麦克风***中的所述主要路径进行建模;
所述主要路径的建模是基于所述期望源扬声器-房间-麦克风***中的本征模;并且
其中,所述本征模对应于通过所述均衡滤波器模块的所述可控制传递函数建模的编码的原始声波场;并且
其中,所述本征模被解码以提供与原始声波场相似的场。
2.根据权利要求1所述的***,其还包括至少一个第二组麦克风,其环状安置在听者的头部、人工头部或刚球周围。
3.根据权利要求1所述的***,其还包括至少两个第三组麦克风,其中所述至少两个第三组麦克风和所述第一组麦克风一起球状安置在听者的头部周围,人工头部周围或人工头部中,或者刚球周围或刚球中。
4.根据权利要求3所述的***,其中所述球状安置的麦克风的组以规则型式安置。
5.根据权利要求1所述的***,其还包括至少三个第四组麦克风,其被安置在所述第一组麦克风的每一个麦克风周围。
6.根据权利要求1-5中任一项所述的***,其中所述至少两个第一组麦克风中的两组被布置在其中听者的耳朵在所述目标扬声器-房间-麦克风***中或将在所述目标扬声器-房间-麦克风***中的位置中或接近所述位置。
7.一种被配置来在目标扬声器-房间-麦克风***中的聆听位置周围生成声波场的方法,其中,K≥1组扬声器的扬声器阵列,其中每一组扬声器具有至少一个扬声器,被安置在所述聆听位置周围,以及M≥2组麦克风的麦克风阵列,其中每一组麦克风具有至少一个麦克风,被安置在所述聆听位置处,所述方法包括:
在所述K组扬声器的信号路径上游和输入信号路径的下游中利用可控制传递函数进行均衡滤波,
基于来自M组麦克风的M个误差信号和所述输入信号路径上的输入信号,根据自适应控制算法,经由均衡滤波模块来利用用于均衡滤波的所述可控制传递函数的均衡控制信号进行控制,其中
所述麦克风阵列包括至少两个第一组麦克风,其环状安置在听者的头部周围,人工头部周围或人工头部中,或者刚球周围或刚球中,
在所述M组麦克风的信号路径上游和所述输入信号路径的下游对呈现在期望源扬声器-房间-麦克风***中的主要路径进行建模,
对所述主要路径的建模是基于所述期望源扬声器-房间-麦克风***中的本征模;并且
其中,所述本征模对应于通过执行均衡滤波的所述可控制传递函数建模的编码的原始声波场;并且
其中,所述本征模被解码以提供与原始声波场相似的场。
8.根据权利要求7所述的方法,其还包括至少一个第二组麦克风,其环状安置在听者的头部、人工头部或刚球周围。
9.根据权利要求7所述的方法,其还包括至少两个第三组麦克风,其中所述至少两个第三组麦克风和所述第一组麦克风一起被球状安置在听者的头部周围,人工头部周围或人工头部中,或者刚球周围或刚球中。
10.根据权利要求9所述的方法,其中所述球状安置的麦克风的组以规则型式安置。
11.根据权利要求7所述的方法,其还包括至少三个第四组麦克风,其被安置在所述第一组麦克风的每一个麦克风周围。
12.根据权利要求7-11中任一项所述的方法,其中所述至少两个第一组麦克风中的两组被布置在其中听者的耳朵在目标扬声器-房间-麦克风***中或将在目标扬声器-房间-麦克风***中的位置中或接近所述位置。
CN201580016986.4A 2014-04-07 2015-03-24 用于声波场生成的***和方法 Active CN106664480B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14163718.1A EP2930958A1 (en) 2014-04-07 2014-04-07 Sound wave field generation
EP14163718.1 2014-04-07
PCT/EP2015/056196 WO2015154986A1 (en) 2014-04-07 2015-03-24 Sound wave field generation

Publications (2)

Publication Number Publication Date
CN106664480A CN106664480A (zh) 2017-05-10
CN106664480B true CN106664480B (zh) 2021-06-15

Family

ID=50434125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580016986.4A Active CN106664480B (zh) 2014-04-07 2015-03-24 用于声波场生成的***和方法

Country Status (5)

Country Link
US (1) US10715917B2 (zh)
EP (1) EP2930958A1 (zh)
JP (1) JP6695808B2 (zh)
CN (1) CN106664480B (zh)
WO (1) WO2015154986A1 (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107251579B (zh) * 2015-04-08 2019-11-26 华为技术有限公司 驱动扬声器阵列的装置和方法
EP3304929B1 (en) * 2015-10-14 2021-07-14 Huawei Technologies Co., Ltd. Method and device for generating an elevated sound impression
US10206040B2 (en) * 2015-10-30 2019-02-12 Essential Products, Inc. Microphone array for generating virtual sound field
WO2017118551A1 (en) * 2016-01-04 2017-07-13 Harman Becker Automotive Systems Gmbh Sound wave field generation
EP3188504B1 (en) 2016-01-04 2020-07-29 Harman Becker Automotive Systems GmbH Multi-media reproduction for a multiplicity of recipients
JP6863370B2 (ja) * 2016-04-21 2021-04-21 株式会社ソシオネクスト 信号処理装置
US10084553B1 (en) * 2016-12-22 2018-09-25 Seagate Technology Llc Iterative recovery from baseline or timing disturbances
GB2561021B (en) * 2017-03-30 2019-09-18 Cirrus Logic Int Semiconductor Ltd Apparatus and methods for monitoring a microphone
US10403258B2 (en) * 2017-07-28 2019-09-03 Harman Becker Automotive Systems Gmbh Silent zone generation
GB2567018B (en) 2017-09-29 2020-04-01 Cirrus Logic Int Semiconductor Ltd Microphone authentication
US11769510B2 (en) 2017-09-29 2023-09-26 Cirrus Logic Inc. Microphone authentication
KR101956784B1 (ko) * 2017-11-30 2019-06-19 (주)에스엠인스트루먼트 구조 개선된 마이크로폰 구형 어레이를 갖는 전방향 음향 신호 습득장치
CN108226884B (zh) * 2017-12-27 2020-10-27 成都锐芯盛通电子科技有限公司 一种有源相控阵雷达天线近场校准的方法
TWI688280B (zh) * 2018-09-06 2020-03-11 宏碁股份有限公司 正交基底修正之音效控制方法及音效輸出裝置
SE543816C2 (en) * 2019-01-15 2021-08-03 Faurecia Creo Ab Method and system for creating a plurality of sound zones within an acoustic cavity
GB2584610B (en) * 2019-05-07 2023-02-15 Alexander Charles Gort Barten Beverage capsule
WO2020257491A1 (en) 2019-06-21 2020-12-24 Ocelot Laboratories Llc Self-calibrating microphone and loudspeaker arrays for wearable audio devices
US11264015B2 (en) 2019-11-21 2022-03-01 Bose Corporation Variable-time smoothing for steady state noise estimation
US11374663B2 (en) * 2019-11-21 2022-06-28 Bose Corporation Variable-frequency smoothing
CN111954146B (zh) * 2020-07-28 2022-03-01 贵阳清文云科技有限公司 虚拟声环境合成装置
CN112235691B (zh) * 2020-10-14 2022-09-16 南京南大电子智慧型服务机器人研究院有限公司 一种混合式的小空间声重放品质提升方法
KR20220097075A (ko) * 2020-12-31 2022-07-07 엘지디스플레이 주식회사 차량용 음향 제어 시스템, 이를 포함하는 차량, 및 차량용 음향 제어 방법
CN113299263B (zh) * 2021-05-21 2024-05-24 北京安声浩朗科技有限公司 声学路径确定方法、装置、可读存储介质及主动降噪耳机
CN114268883A (zh) * 2021-11-29 2022-04-01 苏州君林智能科技有限公司 一种选择麦克风布放位置的方法与***
CN114582312B (zh) * 2022-02-14 2022-11-22 中国科学院声学研究所 一种车内抗干扰自适应路噪主动控制方法及控制***
US11983337B1 (en) 2022-10-28 2024-05-14 Dell Products L.P. Information handling system mouse with strain sensor for click and continuous analog input
US11914800B1 (en) 2022-10-28 2024-02-27 Dell Products L.P. Information handling system stylus with expansion bay and replaceable module
US11983061B1 (en) 2022-10-28 2024-05-14 Dell Products L.P. Information handling system peripheral device sleep power management

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1643982A (zh) * 2002-02-28 2005-07-20 雷米·布鲁诺 用于控制声场再现单元的方法和器件
CN1672325A (zh) * 2002-06-05 2005-09-21 索尼克焦点公司 声虚拟现实引擎和增强传送音的高级技术
CN1735922A (zh) * 2002-11-19 2006-02-15 法国电信局 处理音频数据的方法和实行这个方法的声音获取设备
CN1941075A (zh) * 2005-09-30 2007-04-04 中国科学院声学研究所 一种面向目标的声辐射生成方法
CN101001485A (zh) * 2006-10-23 2007-07-18 中国传媒大学 一种有限声源多通道声场***及声场模拟方法
EP2373054A1 (de) * 2010-03-09 2011-10-05 Technische Universität Berlin Wiedergabe in einem beweglichen Zielbeschallungsbereich mittels virtueller Lautsprecher
CN102333265A (zh) * 2011-05-20 2012-01-25 南京大学 一种基于连续声源概念的三维局部空间声场重放方法
CN102932730A (zh) * 2012-11-08 2013-02-13 武汉大学 一种正四面体结构的扬声器组声场效果增强方法及***
EP2637428A1 (en) * 2012-03-06 2013-09-11 Thomson Licensing Method and Apparatus for playback of a Higher-Order Ambisonics audio signal
WO2013141768A1 (en) * 2012-03-22 2013-09-26 Dirac Research Ab Audio precompensation controller design using a variable set of support loudspeakers

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5416845A (en) * 1993-04-27 1995-05-16 Noise Cancellation Technologies, Inc. Single and multiple channel block adaptive methods and apparatus for active sound and vibration control
FI20020865A (fi) * 2002-05-07 2003-11-08 Genelec Oy Menetelmä matalataajuisen modaalisen ekvalisaattorin suunnittelemiseksi erityisesti lähekkäin sijaitsevia moodeja varten
JP2004064739A (ja) * 2002-06-07 2004-02-26 Matsushita Electric Ind Co Ltd 音像制御システム
CA2430403C (en) 2002-06-07 2011-06-21 Hiroyuki Hashimoto Sound image control system
AU2002329160A1 (en) 2002-08-13 2004-02-25 Nanyang Technological University Method of increasing speech intelligibility and device therefor
JP4243513B2 (ja) * 2003-05-06 2009-03-25 株式会社エー・アール・アイ 3次元音場再生装置
JP2005198251A (ja) * 2003-12-29 2005-07-21 Korea Electronics Telecommun 球体を用いた3次元オーディオ信号処理システム及びその方法
CA2621916C (en) 2004-09-07 2015-07-21 Sensear Pty Ltd. Apparatus and method for sound enhancement
CN101300897A (zh) 2005-11-01 2008-11-05 皇家飞利浦电子股份有限公司 包括声音跟踪装置的助听器
ATE491314T1 (de) 2006-04-05 2010-12-15 Harman Becker Automotive Sys Verfahren zum automatischen entzerren eines beschallungssystems
EP1986466B1 (en) 2007-04-25 2018-08-08 Harman Becker Automotive Systems GmbH Sound tuning method and apparatus
US20080273724A1 (en) * 2007-05-04 2008-11-06 Klaus Hartung System and method for directionally radiating sound
JP2009027331A (ja) * 2007-07-18 2009-02-05 Clarion Co Ltd 音場再現システム
JP2010136027A (ja) * 2008-12-03 2010-06-17 Clarion Co Ltd 音響測定システムおよび音響収録装置
EP2326108B1 (en) 2009-11-02 2015-06-03 Harman Becker Automotive Systems GmbH Audio system phase equalizion
JP5590951B2 (ja) * 2010-04-12 2014-09-17 アルパイン株式会社 音場制御装置および音場制御方法
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
JP5909665B2 (ja) * 2011-12-27 2016-04-27 パナソニックIpマネジメント株式会社 音場制御装置および音場制御方法
US10148903B2 (en) * 2012-04-05 2018-12-04 Nokia Technologies Oy Flexible spatial audio capture apparatus
EP2816824B1 (en) 2013-05-24 2020-07-01 Harman Becker Automotive Systems GmbH Sound system for establishing a sound zone
EP2806664B1 (en) 2013-05-24 2020-02-26 Harman Becker Automotive Systems GmbH Sound system for establishing a sound zone
EP2806663B1 (en) 2013-05-24 2020-04-15 Harman Becker Automotive Systems GmbH Generation of individual sound zones within a listening room
EP2866465B1 (en) 2013-10-25 2020-07-22 Harman Becker Automotive Systems GmbH Spherical microphone array
EP2930956B1 (en) 2014-04-07 2020-07-22 Harman Becker Automotive Systems GmbH Adaptive filtering
EP2930957B1 (en) 2014-04-07 2021-02-17 Harman Becker Automotive Systems GmbH Sound wave field generation
EP2930953B1 (en) 2014-04-07 2021-02-17 Harman Becker Automotive Systems GmbH Sound wave field generation
EP2930955B1 (en) 2014-04-07 2021-02-17 Harman Becker Automotive Systems GmbH Adaptive filtering
EP2930954B1 (en) 2014-04-07 2020-07-22 Harman Becker Automotive Systems GmbH Adaptive filtering
EP3040984B1 (en) 2015-01-02 2022-07-13 Harman Becker Automotive Systems GmbH Sound zone arrangment with zonewise speech suppresion

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1643982A (zh) * 2002-02-28 2005-07-20 雷米·布鲁诺 用于控制声场再现单元的方法和器件
CN1672325A (zh) * 2002-06-05 2005-09-21 索尼克焦点公司 声虚拟现实引擎和增强传送音的高级技术
CN1735922A (zh) * 2002-11-19 2006-02-15 法国电信局 处理音频数据的方法和实行这个方法的声音获取设备
CN1941075A (zh) * 2005-09-30 2007-04-04 中国科学院声学研究所 一种面向目标的声辐射生成方法
CN101001485A (zh) * 2006-10-23 2007-07-18 中国传媒大学 一种有限声源多通道声场***及声场模拟方法
EP2373054A1 (de) * 2010-03-09 2011-10-05 Technische Universität Berlin Wiedergabe in einem beweglichen Zielbeschallungsbereich mittels virtueller Lautsprecher
CN102333265A (zh) * 2011-05-20 2012-01-25 南京大学 一种基于连续声源概念的三维局部空间声场重放方法
EP2637428A1 (en) * 2012-03-06 2013-09-11 Thomson Licensing Method and Apparatus for playback of a Higher-Order Ambisonics audio signal
WO2013141768A1 (en) * 2012-03-22 2013-09-26 Dirac Research Ab Audio precompensation controller design using a variable set of support loudspeakers
CN102932730A (zh) * 2012-11-08 2013-02-13 武汉大学 一种正四面体结构的扬声器组声场效果增强方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高精度球面阵聚焦声源定位方法研究;刘月婵等;《声学学报》;20130531;第533-540页 *

Also Published As

Publication number Publication date
CN106664480A (zh) 2017-05-10
WO2015154986A1 (en) 2015-10-15
EP2930958A1 (en) 2015-10-14
JP2017514360A (ja) 2017-06-01
US10715917B2 (en) 2020-07-14
US20170034623A1 (en) 2017-02-02
JP6695808B2 (ja) 2020-05-20

Similar Documents

Publication Publication Date Title
CN106664480B (zh) 用于声波场生成的***和方法
CN104980859B (zh) 产生声波场的***和方法
EP2930957B1 (en) Sound wave field generation
US9749743B2 (en) Adaptive filtering
CN104980856B (zh) 自适应滤波***及方法
KR102160645B1 (ko) 개별 사운드 구역을 제공하기 위한 장치 및 방법
JP5357115B2 (ja) オーディオシステム位相イコライゼーション
US10460716B2 (en) Sound wave field generation based on loudspeaker-room-microphone constraints
US20040223620A1 (en) Loudspeaker system for virtual sound synthesis
KR102573843B1 (ko) 음성 제어를 갖는 낮은 복잡도의 다중 채널 스마트 라우드스피커
US20200267490A1 (en) Sound wave field generation
CN113645531A (zh) 一种耳机虚拟空间声回放方法、装置、存储介质及耳机
Brännmark et al. Controlling the impulse responses and the spatial variability in digital loudspeaker-room correction.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant