CN106105261B - 声场声音拾取装置和方法、声场再现装置和方法以及程序 - Google Patents

声场声音拾取装置和方法、声场再现装置和方法以及程序 Download PDF

Info

Publication number
CN106105261B
CN106105261B CN201580011901.3A CN201580011901A CN106105261B CN 106105261 B CN106105261 B CN 106105261B CN 201580011901 A CN201580011901 A CN 201580011901A CN 106105261 B CN106105261 B CN 106105261B
Authority
CN
China
Prior art keywords
frequency spectrum
linear
spatial
microphone
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580011901.3A
Other languages
English (en)
Other versions
CN106105261A (zh
Inventor
光藤祐基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN106105261A publication Critical patent/CN106105261A/zh
Application granted granted Critical
Publication of CN106105261B publication Critical patent/CN106105261B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/403Linear arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

本技术涉及一种使得能够以更低成本准确地再现声场的声场采集装置和方法、声场再现装置和方法以及程序。每个线性麦克风阵列输出通过采集声场获得的声音采集信号。空间频率分析单元对每个声音采集信号执行空间频率变换,以计算空间频谱。空间移位单元对所述空间频谱执行空间移位,使得所述线性麦克风阵列的中心坐标变得相同,以获得空间移位谱。空间域信号混合单元混合多个空间移位谱,以获得单个麦克风混合信号。通过以这种方式混合所述多个线性麦克风阵列的所述声音采集信号,以低成本准确地再现声场是可能的。本技术可应用于声场再现器。

Description

声场声音拾取装置和方法、声场再现装置和方法以及程序
技术领域
本技术涉及一种声场采集装置和方法、声场再现装置和方法以及程序,且更具体而言,涉及一种使得能够以更低成本准确地再现声场的声场采集装置和方法、声场再现装置和方法以及程序。
发明背景
在相关领域,已知一种波前合成技术,其使用多个麦克风采集声场中的声音的波前,并且基于所获得的声音采集信号再现声场。
例如,作为一种关于波前合成的技术,已经提出在其中将声源放置在虚拟空间中的技术,在该虚拟空间中,假设采集目标声源,并且在配置有放置成行的多个扬声器的线性扬声器阵列处再现来自每个声源的声音(例如,参见非专利文献1)。
进一步地,也已经提出以下一种技术,其将非专利文献1中公开的技术应用于配置有放置成行的多个麦克风的线性麦克风阵列(例如,参见非专利文献2)。在非专利文献2中公开的技术中,从通过对空间频率的处理而使用一个线性麦克风采集声音获得的声音采集信号产生声压梯度,并且使用一个线性扬声器阵列再现声场。
以这种方式使用线性麦克风阵列使通过对声音采集信号执行时频变换而在频域中执行处理成为可能,使得通过在空间频率下进行重采样而使用任意线性扬声器阵列再现声场是可能的。
引用列表
非专利文献
非专利文献1:Jens Adrens,Sascha Spors,“Applying the AmbisonicsApproach on Planar and Linear Arrays of Loudspeakers,”in 2nd InternationalSymposium on Ambisonics and Spherical Acoustics
非专利文献2:Shoichi Koyama et al.,“Design of Transform Filter forSound Field Reproduction using Micorphone Array and Loudspeaker Array,”IEEEWorkshop on Applications of Signal Processing to Audio and Acoustics 2011
发明概要
技术问题
然而,在存在使用线性麦克风阵列试图更准确地再现声场的技术的情况下,需要一种更高性能的线性麦克风阵列,因为线性麦克风阵列将用于采集波前。这种高性能线性麦克风阵列是昂贵的,并且难以以低成本准确地再现声场。
本技术已鉴于这种情况进行研发,并且旨在以更低成本再现声场。
问题的解决方案
根据本技术的第一方面,提供了一种声场采集装置,其包括:第一时频分析单元,其被配置为对通过由包括具有第一特性的麦克风的第一线性麦克风阵列进行声音采集而获得的声音采集信号执行时频变换,以计算第一时频谱;第一空间频率分析单元,其被配置为对第一时频谱执行空间频率变换,以计算第一空间频谱;第二时频分析单元,其被配置为通过由包括具有与第一特性不同的第二特性进行的声音采集而获得的声音采集信号执行时频变换,以计算第二时频谱;第二空间频率分析单元,其被配置为对第二时间频率执行空间频率变换,以计算第二空间频谱;和空间域信号混合单元,其被配置为混合第一空间频谱和第二空间频谱,以计算麦克风混合信号。
可进一步包括空间移位单元,其被配置为根据第一线性麦克风阵列与第二线性麦克风阵列之间的位置关系来使第一空间频谱的相位移位。空间域混合单元可混合第二空间频谱和相位被移位的第一空间频谱。
空间域信号混合单元可对第一空间频谱或第二空间频谱执行补零,使得第一空间频谱的点数量变得与第二空间频谱的点数量相同。
空间域信号混合单元可通过使用预定混合系数对第一空间频谱和第二空间频谱执行权重相加来执行混合。
可将第一线性麦克风阵列和第二线性麦克风阵列放置在同一行上。
第一线性麦克风阵列中所包括的麦克风的数量可以和第二线性麦克风阵列中所包括的麦克风的数量不同。
第一线性麦克风阵列的长度可以和第二线性麦克风阵列的长度不同。
第一线性麦克风中所包括的麦克风之间的间隔可以和第二线性麦克风中所包括的麦克风之间的间隔不同。
根据本技术的第一方面,提供了一种包括以下步骤的声场采集方法或程序:对通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第一时频谱;对第一时频谱执行空间频率变换,以计算第一空间频谱;对通过包括具有与第一特性不同的第二特性的麦克风的第二线性麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第二时频谱;对第二时频谱执行空间频率变换,以计算第二空间频谱;以及混合第一空间频谱和第二空间频谱,以计算麦克风混合信号。
在本技术的第一方面中,对通过包括具有第一特性的麦克风的第一线性麦克风进行的声音采集获得的声音采集信号执行时频变换,以计算第一时频谱;对第一时频谱执行空间频率变换,以计算第一空间频谱;对通过包括具有与第一特性不同的第二特性的麦克风的第二麦克风进行的声音采集获得的声音采集信号执行时频变换,以计算第二时频谱;对第二时频谱执行空间频率变换,以计算第二空间频谱;以及混合第一空间频谱和第二空间频谱,以计算麦克风混合信号。
根据本技术的第二方面,提供一种声场再现装置,其包括:空间重采样单元,其被配置为在线性扬声器阵列确定的空间采样频率下对麦克风混合信号执行空间频率逆变换以计算时频谱,所述麦克风混合信号通过混合从通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号计算出的第一空间频谱和从通过具有与第一特性不同的第二特性的麦克风的第二线性麦克风阵列进行的声音采集获得的声音采集信号计算出的第二空间频谱而获得;和时频合成单元,其被配置为对时频谱执行时频合成,以产生用于通过线性扬声器阵列再现声场的驱动信号。
根据本技术的第二方面,提供了一种包括下列步骤的声场再现方法或程序:在线性扬声器阵列确定的空间采样频率下对麦克风混合信号执行空间频率逆变换以计算时频谱,所述麦克风混合信号通过混合从通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号计算出的第一空间频谱和从通过具有与第一特性不同的第二特性的麦克风的第二线性麦克风阵列进行的声音采集获得的声音采集信号计算出的第二空间频谱而获得;以及对时频谱执行时频合成,以产生用于通过线性扬声器阵列再现声场的驱动信号。
在本技术的第二方面中,在线性扬声器阵列确定的空间采样频率下对麦克风混合信号执行空间频率逆变换以计算时频谱,所述麦克风混合信号通过混合从通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号计算出的第一空间频谱和从通过具有与第一特性不同的第二特性的麦克风的第二线性麦克风阵列进行的声音采集获得的声音采集信号计算出的第二空间频谱而获得;以及对时频谱执行时频合成,以产生用于通过线性扬声器阵列再现声场的驱动信号。
本发明的有利效果
根据本技术的第一方面和第二方面,以更低成本准确地再现声场是可能的。
应注意,本技术的有利影响不限于本文中描述的那些,并且可以是本公开中描述的任何有利影响。
附图简述
图1是解释根据本技术的实施方案的由多个线性麦克风阵列进行的声音采集的图表。
图2是解释根据本技术的声场再现的图表。
图3是图示根据本技术的实施方案的声场发生器的配置实例的图表。
图4是解释根据本技术的实施方案在空间频率中的补零的图表。
图5是解释根据本技术的实施方案的声场再现处理的流程图。
图6是图示本技术的实施方案的计算机的配置实例的图表。
具体实施方式
下文将参考附图描述应用本技术的实施方案。
<第一实施方案>
<关于本技术>
本技术是以下一种技术:其中使用配置有在实空间中布置成行的多个麦克风的线性麦克风阵列来采集声音的波前,并且基于由于使用配置有布置成行的多个扬声器的线性扬声器阵列进行声音采集而获得的声音采集信号来再现声场。
当使用线性麦克风阵列和线性扬声器阵列再现声场,以试图更准确地再现声场时,需要更高性能的线性麦克风阵列,并且这种高性能的线性麦克风阵列是昂贵的。
因此,例如如图1中图示,将考虑使用相互具有不同特性的线性麦克风阵列MA11和线性麦克风阵列MA12进行的声音采集。
在本文中,线性麦克风阵列MA11例如配置有具有相对良好的声特性的麦克风,并且线性麦克风阵列MA11中所包括的麦克风以固定间隔布置成行。通常地,因为具有良好声特性的麦克风的大小(体积)较大,所以以窄间隔布置线性麦克风阵列中所包括的麦克风是困难的。
进一步地,麦克风阵列MA12配置有声特性不太良好但比例如线性麦克风阵列MA11中所包括的麦克风小的麦克风,并且线性麦克风阵列MA12中所包括的麦克风也以固定间隔布置成行。
通过以这种方式使用相互具有不同特性的多个线性麦克风阵列,例如可扩大将被再现的声场的动态范围或频率范围或提高声音采集信号的空间频率分辨率。通过这种方式,可以更低成本准确地再现声场。
当使用两个线性麦克风阵列采集声音时(例如,如使用箭头A11指示),在物理上,不可能将线性麦克风阵列MA11中所包括的麦克风和线性麦克风阵列MA12中所包括的麦克风放置在相同坐标(相同位置)上。
进一步地,当如使用箭头A12指示,线性麦克风阵列MA11和线性麦克风阵列MA12不在同一行上时,因为在相应线性麦克风阵列处采集的声场的中心坐标是不同的,所以不能使用单个线性扬声器阵列再现单个声场。
仍进一步地,如使用箭头A13指示,通过替代地将线性麦克风阵列MA11中所包括的麦克风和线性麦克风阵列MA12中所包括的麦克风放置成行使得麦克风相互不重叠,可将在相应线性麦克风阵列处采集的声场的中心坐标布置在相同位置处。
然而,在这种情况下,声音采集信号的传输量增加了与线性麦克风阵列的数量对应的量,这导致传输成本的增加。
因此,在本技术中,例如,如图2中图示,混合并传输多个声音采集信号,所述声音采集信号由通过以不同间隔或固定间隔将具有不同特性(诸如,实空间中的声特性和体积(大小))的多个麦克风放置成行而配置的多个线性麦克风阵列采集。然后,在声音采集信号的接收侧,产生线性扬声器阵列的驱动信号,使得实空间中的声场与再现空间中的声场相等。
具体而言,在图2中,将配置有多个麦克风MCA的线性麦克风阵列MA21和配置有多个麦克风MCB(其具有与麦克风MCA的特性不同的特性)的线性麦克风阵列MA22布置在实空间中的同一行上。
在该实例中,以固定间隔DA布置麦克风MCA,以及以固定间隔DB布置麦克风MCB。进一步地,麦克风MCA和麦克风MCB被布置成使得布置位置(坐标)在物理上相互不重叠。
应注意,在图2中,将参考符号MCA仅分配到线性麦克风阵列MA21中所包括的麦克风的一部分。以类似方式,将参考符号MCB仅分配到线性麦克风阵列MA22中所包括的麦克风的一部分。
进一步地,在其中实空间中的声场将被再现的再现空间中,放置有线性扬声器阵列SA11,所述线性扬声器阵列SA11配置有以间隔DC布置成行的多个扬声器SP,并且扬声器SP布置的所述间隔DC与上述间隔DA或DB不同。应注意,在图2中,将参考符号SP仅分配到线性扬声器阵列SA11中所包括的扬声器的一部分。
以这种方式,在实空间中,声音的实波前由具有不同特性的这两种类型的线性麦克风阵列MA21和线性麦克风阵列MA22采集,并且所获得的声音信号被用作声音采集信号。
因为布置线性麦克风阵列中所包括的麦克风的间隔在这两种类型的线性麦克风阵列之间不同,所以可认为,在相应线性麦克风阵列处所获得的声音采集信号的空间采样频率不同。
因此,在时频域中不能简单地混合每个线性麦克风阵列所获得的声音采集信号。也就是说,因为麦克风的位置,即实波前被记录(采集)的位置,对于每个线性麦克风阵列而言是不同的,并且声场不重叠,所以在时频域中不能简单地混合声音采集信号。
因此,在本技术中,使用正交基将每个声音采集信号正交地变换成独立于坐标位置的空间频率域,并且在空间频率域中混合频谱。
进一步地,当配置有两种类型的麦克风的两种类型的线性麦克风阵列的中心坐标不同时,在通过在空间频率域中对声音采集信号执行相移而使线性麦克风阵列的中心坐标相同之后混合声音采集信号。在本文中,假设每个线性麦克风阵列的中心坐标例如为位于线性麦克风阵列的两端处的两个麦克风的中间位置。
当以这种方式混合线性麦克风阵列MA21的声音采集信号和线性麦克风阵列MA22的声音采集信号时,将通过混合所获得的麦克风混合信号传输到再现空间。然后,对所传输的麦克风混合信号执行空间频率逆变换,所传输的麦克风混合信号将被变换成与线性扬声器阵列SA11的扬声器SP的间隔DC对应的空间采样频率下的信号,并且使所获得的信号变成线性扬声器阵列SA11的扬声器驱动信号。基于以这种方式获得的扬声器驱动信号在线性扬声器阵列SA11处再现声音,并且输出再现波前。也就是说,再现实空间中的声场。
如上所述,将多个线性麦克风阵列用作声场采集装置并且将单个线性扬声器阵列用作声音再现装置的本技术的声场再现器特别具有以下特征(1)至(3)。
特征(1)
例如,通过使一个线性麦克风阵列配置有小硅(small silicon)麦克风并且以比其它麦克风的间隔窄的间隔布置多个小硅麦克风,可增加声音采集信号的空间频率分辨率并且降低再现区域中的空间混叠。特别地,如果可以低成本提供小硅麦克风,那么本技术的声场再现器具有更大优点。
特征(2)
通过组合具有不同动态范围或频率范围的多个麦克风而配置多个线性麦克风阵列,可扩大将被再现的声音的动态范围或频率范围。
特征(3)
通过对多个线性麦克风阵列的声音采集信号执行空间频率变换、混合所获得的信号并且仅传输所获得的麦克风混合信号的空间频段中的所需分量,可降低传输成本。
<声场再现器的配置实例>
应用本技术的具体实施方案接下来将被描述为在其中将本技术应用到声场再现器的情况的实例。
图3是图示应用本技术的声场再现器的实施方案的配置实例的图表。
声场再现器11具有线性麦克风阵列21-1、线性麦克风阵列21-2、时频分析单元22-1、时频分析单元22-2、空间频率分析单元23-1、空间频率分析单元23-2、空间移位单元24-1、空间移位单元24-2、空间域信号混合单元25、通信单元26、通信单元27、空间重采样单元28、时频合成单元29和线性扬声器阵列30。
在该实例中,线性麦克风阵列21-1、线性麦克风阵列21-2、时频分析单元22-1、时频分析单元22-2、空间频率分析单元23-1、空间频率分析单元23-2、空间移位单元24-1、空间移位单元24-2、空间域信号混合单元25和通信单元26被放置在声音的实波前被采集的实空间中。使用这些线性麦克风阵列21-1至通信单元26来实现声场采集装置41。
同时,在将被再现的实波前所在的再现空间中,放置有通信单元27、空间重采样单元28、时频合成单元29和线性扬声器阵列30,并且使用这些通信单元27至线性扬声器阵列30来实现声场再现装置42。
线性麦克风阵列21-1和线性麦克风阵列21-2采集实空间中的声音的实波前,并且提供由于时频分析单元22-1和时频分析单元22-2的采集而获得的声音采集信号。
在本文中,将线性麦克风阵列21-1中所包括的麦克风和线性麦克风阵列21-2中所包括的麦克风放置在同一行上。
进一步地,线性麦克风阵列21-1和线性麦克风阵列21-2相互具有不同特性。
具体而言,例如,线性麦克风阵列21-1中所包括的麦克风和线性麦克风阵列21-2中所包括的麦克风具有不同特性,诸如声特性和体积(大小)。进一步地,使线性麦克风阵列21-1中所包括的麦克风的数量与线性麦克风阵列21-2中所包括的麦克风的数量不同。
仍进一步地,布置线性麦克风阵列21-1中所包括的麦克风的间隔与布置线性麦克风阵列21-2中所包括的麦克风的间隔不同。进一步地,例如,线性麦克风阵列21-1的长度与线性麦克风阵列21-2的长度不同。在本文中,线性麦克风阵列的长度为线性麦克风阵列中所包括的麦克风被布置的方向上的长度。
以这种方式,这两个线性麦克风阵列为具有不同各种特性的线性麦克风阵列,诸如麦克风自身的特性、麦克风的数量和麦克风被布置的间隔。
应注意,在下文中,当不需要特别区分线性麦克风阵列21-1与线性麦克风阵列21-2时,它们也将被简称为线性麦克风阵列21。进一步地,当使用两种类型的线性麦克风阵列21采集实波前的实例将在本文中被描述时,也可能使用三种或更多种类型的线性麦克风阵列21。
时频分析单元22-1和时频分析单元22-2对从线性麦克风阵列21-1和线性麦克风阵列21-2提供的声音采集信号执行时频变换,并且将所获得的时频谱提供到空间频率分析单元23-1和空间频率分析单元23-2。
应注意,在下文中,当不需要当不需要特别区分时频分析单元22-1与时频分析单元22-2时,它们也将被简称为时频分析单元22。
空间频率分析单元23-1和空间频率分析单元23-2对从时频分析单元22-1和时频分析单元22-2提供的时频谱执行空间频率变换,并且将由于空间频率变换而获得的空间频谱提供到空间移位单元24-1和空间移位单元24-2。
应注意,在下文中,当不需要特别区分空间频率分析单元23-1与空间频率分析单元23-2时,它们也将被简称为空间频率分析单元23。
空间移位单元24-1和空间移位单元24-2通过空间地移位从空间频率分析单元23-1和空间频率分析单元23-2提供的空间频谱而使线性麦克风阵列21的中心坐标相同,并且将所获得的空间移位谱提供到空间域信号混合单元25。
应注意,在下文中,当不需要特别区分空间移位单元24-1与空间移位单元24-2时,它们也将被简称为空间移位单元24。
空间域信号混合单元25混合从空间移位单元24-1和空间移位单元24-2提供的空间移位谱,并且将由于混合而获得的单个麦克风混合信号提供到通信单元26。通信单元26例如通过无线通信等传输从空间域混合单元25提供的麦克风混合信号。应注意,麦克风混合信号的传输(传送)不限于通过无线通信的传输,但是可为通过有线通信的传输或为通过为无线通信和有线通信的组合的通信的传输。
通信单元27接收从通信单元26传输的麦克风混合信号,并且将麦克风混合信号提供到空间重采样单元28。空间重采样单元28基于从通信单元27提供的麦克风混合信号产生时频谱(其为使用线性麦克风阵列30再现实空间中的实波前的驱动信号),并且将时频谱提供到时频合成单元29。
时频合成单元29对从空间重采样单元28提供的时频谱执行时频合成或帧合成,并且将由于合成而获得的扬声器驱动信号提供到线性扬声器阵列30。线性扬声器阵列30基于从时频合成单元29提供的扬声器驱动信号再现声音。通过这种方式,再现实空间中的声场(实波前)。
在本文中,将更详细地描述声场再现器11中所包括的组件。
(时频分析单元)
时频分析单元22针对具有不同特性(诸如,声特性和体积)的I个线性麦克风阵列21分析在线性麦克风阵列21中所包括的每个麦克风(麦克风传感器)处获得的声音采集信号s(nmic,t)。
应注意,声音采集信号s(nmic,t)中的nmic为指示线性麦克风阵列21中所包括的每个麦克风的麦克风标引,以及麦克风标引nmic=0,...,Nmic-1。应注意,Nmic指示线性麦克风阵列21中所包括的麦克风的数量。进一步地,声音采集信号s(nmic,t)中的t指示时间。在图3的实例中,线性麦克风阵列21的数量I=2。
时频分析单元22对声音采集信号s(nmic,t)执行固定大小的时帧分割,以获得输入帧信号sfr(nmic,nfr,l)。然后,时频分析单元22将输入帧信号sfr(nmic,nfr,l)乘以在以下等式(1)中指示的窗函数wT(nfr)以获得窗函数应用信号sw(nmic,nfr,l)。也就是说,执行以下等式(2)中的计算以计算窗函数应用信号sw(nmic,nfr,l)。
[公式1]
[公式2]
sw(nmic,nfr,|)=wT(nfr)sfr(nmic,nfr,|)…(2)
在本文中,在等式(1)和等式(2)中,nfr指示时间标引,以及时间标引nfr=0,...,Nfr-1。进一步地,1指示时帧标引,以及时帧标引1=0,...,L-1。应注意,Nfr是帧大小(时帧中的样本数量),以及L是帧的总数量。
进一步地,帧大小Nfr为与时间采样频率fs T[Hz]下的一个帧中的时间Tfr[s]对应的样本数量Nfr(=R(fs T×Tfr),其中R()是任意轮函数)。然而,在本实施方案中,例如,一个帧中的时间Tfr=1.0[s],以及轮函数R()为舍入,它们可被不同地设置。进一步地,当帧的移位量被设置为帧大小Nfr的50%时,其可被不同地设置。
仍进一步地,当将Hanning窗的平方根用作窗函数时,可使用诸如Hamming窗和Blackman-Harris窗的其它窗口。
当以这种方式获得窗函数应用信号sw(nmic,nfr,l)时,时频分析单元22通过计算以下等式(3)和(4)对窗函数应用信号sw(nmic,nfr,l)执行时频变换,以计算时频谱S(nmic,nT,l)。
[公式3]
[公式4]
也就是说,补零信号sw′(nmic,mT,l)通过计算等式(3)获得,以及等式(4)是基于所获得的补零信号sw′(nmic,mT,l)进行计算,以计算时频谱S(nmic,nT,l)。
应注意,在等式(3)和等式(4)中,MT指示用于时频变换的点数量。进一步地,nT指示时频谱标引。在本文中,NT=MT/2+1,以及nT=0,...,NT-1。进一步地,在等式(4)中,i指示纯虚数。
进一步地,虽然在本实施方案中,执行使用短时傅里叶变换(STFT)的时频变换,但是可使用诸如离散余弦变换(DCT)和修正离散余弦变换(MDCT)的其它时频变换。
仍进一步地,虽然STFT的点数量MT被设置为接近Nfr的2的幂次方值,其等于或大于Nfr,但是可使用其它点数量MT
时频分析单元22将通过上述处理获得的时频谱S(nmic,nT,l)提供到空间频率分析单元23。
(空间频率分析单元)
随后,空间频率分析单元23通过计算以下等式(5)而对从时频分析单元22提供的时频谱S(nmic,nT,l)执行空间频率变换,以计算空间频谱SSP(nS,nT,l)。
[公式5]
应注意,在等式(5)中,MS指示用于空间频率变换的点数量,以及ms=0,...,MS-1。进一步地,S'(mS,nT,l)指示通过对时频谱S(nmic,nT,l)执行补零而获得的补零信号,以及i指示纯虚数。仍进一步地,nS指示空间频率谱标引。
在本实施方案中,通过计算等式(5)来执行通过离散傅里叶逆变换的空间频率变换。
进一步地,必要时,也可根据IDFT的点数量MS来适当地执行补零。在本实施方案中,假设在线性麦克风阵列21处获得的信号的空间采样频率为fs S[Hz],执行与IDFT的点数量MS对应的补零,使得多个线性麦克风阵列21的长度(阵列长度)X=MS/fs S变得相同,并且将参考长度设置为具有最大阵列长度Xmax的线性麦克风阵列21的长度。然而,可基于其它长度设置点数量MS
具体而言,由线性麦克风阵列21中所包括的麦克风之间的间隔确定空间采样频率fs S,并且点数量MS被确定,使得阵列长度X=MS/fs S变成关于空间采样频率fs S的阵列长度Xmax
关于0≤mS≤Nmic-1的点mS,设定补零信号S'(mS,nT,l)=时频谱S'(mS,nT,l),以及关于Nmic≤mS≤MS-1的点mS,设定补零信号S'(mS,nT,l)=0。
应注意,在该点处,虽然相应线性麦克风阵列21的中心坐标不一定必须相同,但是有必要使相应线性麦克风阵列21的长度MS/fs S相同。空间采样频率fs S或IDFT的点数量MS变成对于每个线性麦克风阵列21不同的值。
通过上述处理获得的空间频谱SSP(nS,nT,l)指示时帧I中所包括的时频nT的信号在空间中呈现哪种波形。空间频率分析单元23将空间频谱SSP(nS,nT,l)提供到空间移位单元24。
(空间移位单元)
空间移位单元24朝与线性麦克风阵列21水平的方向(即,线性麦克风阵列21中所包括的麦克风被布置的方向)空间地移位从空间频率分析单元23提供的空间频谱SSP(nS,nT,l),以获得空间移位谱SSFT(nS,nT,l)。也就是说,空间移位单元24使多个麦克风阵列21的中心坐标相同,使得在多个线性麦克风阵列21处记录的声场可被混合。
具体而言,空间移位单元24计算以下等式(6),以通过改变(移位)空间频率域中的空间频谱的相位而在空间域中执行空间移位,从而由于空间移位而改变时频域中的相位,使得在时域中实现线性麦克风阵列21处获得的信号的时移。
[公式6]
应注意,在等式(6)中,nS指示空间频率谱标引,nT指示时频谱标引,l指示时帧标引,以及i指示纯虚数。
进一步地,kx指示波数[rad/m],以及x指示空间频谱SSP(nS,nT,l)的空间移位量[m]。应注意,假设预先从线性麦克风阵列21的位置关系等获得每个空间频谱SSP(nS,nT,l)的空间移位量x。
仍进一步地,fs S指示空间采样频率[Hz],以及MS指示IDFT的点数量。这些波数kx、空间采样频率fs S、点数量MS以及空间移位量x为对于每个线性麦克风阵列21不同的值。
以这种方式,通过在空间频率域中将空间频谱SSP(nS,nT,l)移位(执行相移)空间移位量x,与在时间方向上移位时间信号的情况相比,可更容易地将线性麦克风阵列21的中心坐标布置在相同位置处。
空间移位单元24将所获得的空间移位谱SSFT(nS,nT,l)提供到空间域信号混合单元25。应注意,在以下描述中,将多个线性麦克风阵列21的每一个的标识符设置为i,并且由标识符i指定的线性麦克风阵列21的空间移位谱SSFT(nS,nT,l)也被描述为SSFT_i(nS,nT,l)。应注意,标识符l=0,…,I-1。
应注意,只需要根据线性麦克风阵列21的位置关系等确定哪个线性麦克风阵列21的空间频谱在多个线性麦克风阵列21的空间频谱SSP(nS,nT,l)之间空间地移位或确定其空间移位量。也就是说,只需要将相应线性麦克风阵列21的中心坐标(换言之,由线性麦克风阵列21采集的声场(声音采集信号)的中心坐标)布置在相同位置处,并且不一定需要使所有线性麦克风阵列21的空间频谱空间地移位。
(空间域信号混合单元)
空间域信号混合单元25通过计算以下等式(7)来混合从多个空间移位单元24提供的多个线性麦克风阵列21的空间移位谱SSFT_i(nS,nT,l),以计算单个麦克风混合信号SMIX(nS,nT,l)。
[公式7]
应注意,在等式(7)中,ai(nS,nT)指示将与每个空间移位谱SSFT_i(nS,nT,l)相乘的混合系数,并且通过使用该混合系数ai(nS,nT)对空间移位谱执行权重相加,计算出麦克风混合信号。
进一步地,为了计算等式(7),执行空间移位谱SSFT_i(nS,nT,l)的补零。
也就是说,虽然已经使由线性麦克风阵列21的标识符i区分的空间移位谱SSFT_i(nS,nT,l)的阵列长度X相同,但是用于空间频率变换的点数量MS不同。
因此,空间域信号混合单元25例如通过对空间移位谱SSFT_i(nS,nT,l)的上限频率执行补零而使空间移位谱SSFT_i(nS,nT,l)的点数量MS相同,以便匹配具有最大空间采样频率fs S[Hz]的线性麦克风阵列21。也就是说,通过使预定空间频率nS中的空间移位谱SSFT_i(nS,nT,l)为零(在适当情况下),执行补零以使得点数量MS相同。
在本实施方案中,例如,通过执行补零以便匹配最大空间频率,使空间采样频率fs S[Hz]相同。
然而,本实施方案不限于此,并且例如当仅将高达特定空间频率的麦克风混合信号传输到声场再现装置42时,可使特定空间频率之后的空间移位谱SSFT_i(nS,nT,l)的值为0(零)。在这种情况下,因为不需要传输不必要的空间频率分量,所以可减少空间移位谱的传输成本。
例如,因为可被再现的声场的空间频段随线性扬声器阵列30中所包括的扬声器的间隔而不同,所以如果传输根据再现空间的再现环境的麦克风混合信号,那么可提高传输效率。
进一步地,将用于空间移位谱SSFT_i(nS,nT,l)的权重相加的混合系数ai(nS,nT)的值取决于时间频率nT和空间频率nS
例如,虽然在本实施方案中,假设相应麦克风阵列21的增益的混合系数ai(nS,nT)=1/Ic(nS)被调整为基本相同,但是混合系数可为其它值。应注意,Ic(nS)为其中在每个空间频段中(即,在空间频率nS下)的空间移位谱SSFT_i(nS,nT,l)不为零值的线性麦克风阵列21的数量。使混合系数ai(nS,nT)=1/Ic(nS),以便计算线性麦克风阵列21之间的平均值。
进一步地,例如,可在考虑相应线性麦克风阵列21的麦克风的频率特性时确定混合系数ai(nS,nT)。例如,还可采用以下配置:其中在低频段中,仅使用线性麦克风阵列21-1的空间移位谱计算麦克风混合信号,然而在高频段中,仅使用线性麦克风阵列21-2的空间移位谱计算麦克风混合信号。
仍进一步地,例如,在考虑麦克风的灵敏度时,可使线性麦克风阵列21(其包括由于灵敏度相对于声压而言过高而导致数字饱和被检测的麦克风)的混合系数为0(零)。
此外,例如,当特定线性麦克风阵列21的特定麦克风存在缺陷并且已知不使用麦克风采集实波前时,或当通过信号的平均值的持续观察来确认未采集的声音时,由于麦克风之间的不连续性而导致在空间频率下的高频段中明显出现非线性噪声。因此,在这种情况下,具有缺陷的线性麦克风阵列21的混合系数ai(nS,nT)被设计为空间低通滤波器。
在本文中,将参考图4描述上述对空间移位谱SSFT_i(nS,nT,l)补零的特定实例。
例如,假设如图4中的箭头A31指示,通过线性麦克风阵列21-1进行的声音采集获得声波前W11,并且如箭头A32指示,通过线性麦克风阵列21-2进行的声音采集获得声波前W12。
应注意,在波前W11和波前W12中,在图4中,水平方向指示布置有实空间中的线性麦克风阵列21的麦克风的方向上的位置,而图4中的垂直方向指示声压。进一步地,波前W11和波前W12上的一个圆圈表示线性麦克风阵列21中所包括的一个麦克风的位置。
在该实例中,因为线性麦克风阵列21-1的麦克风之间的间隔比线性麦克风阵列21-2的麦克风之间的间隔窄,所以波前W11的空间采样频率fs S大于(高于)波前W12的空间采样频率fsS
因此,通过对从波前W11和波前W12获得的时频谱执行空间频率变换(IDFT)且进一步执行空间移位而获得的相应空间移位谱的点数量MS变得不同。
在图4中,使用箭头A33指示的空间移位谱SSFT(nS,nT,l)指示从波前W11获得的空间移位谱,并且空间移位谱的点数量为MS
同时,使用箭头A34指示的空间移位谱SSFT(nS,nT,l)指示从波前W12获得的空间移位谱,并且空间移位谱的点数量为MS’。
应注意,在使用箭头A33和箭头A34指示的空间移位谱中,横轴指示波数kx,而纵轴指示在每个波数kx处,即每个点(空间频率nS)处的空间移位谱的值,更具体而言,频率响应的绝对值。
空间移位谱的点数量由波前的空间采样频率确定,并且在该实例中,因为fs S>fsS,所以使用箭头A34指示的空间移位谱的点数量MS’小于使用箭头A33指示的空间移位谱的点数量MS。也就是说,仅较窄频段中的分量被包括为空间移位谱。
在该实例中,不存在使用箭头A34指示的空间移位谱中的Z11部分和Z12部分中的频段的分量。
因此,不可能通过简单地混合这两个空间移位谱来获得麦克风混合信号(nS,nT,l)。相应地,空间域信号混合单元25例如对使用箭头A34指示的空间移位谱的Z11部分和Z12部分执行补零,以使得两个空间移位谱的点数量相同。也就是说,0(零)被设置为Z11部分和Z12部分的每个点(空间频率nS)处的空间移位谱SSFT(nS,nT,l)的值。
然后,空间域信号混合单元25通过计算等式(7)混合通过补零而具有相同点数量MS的两个空间移位谱,以获得使用箭头A35指示的麦克风混合信号SMIX(nS,nT,l)。应注意,在使用箭头A35指示的麦克风混合信号中,横轴指示波数kx,而纵轴指示每个点处的麦克风混合信号的值。
空间域信号混合单元25将通过上述处理获得的麦克风混合信号SMIX(nS,nT,l)提供到通信单元26,并且使通信单元26传输信号。当麦克风混合信号被通信单元26和通信单元27传输/接收时,麦克风混合信号被提供到空间重采样单元28。
(空间重采样单元)
空间重采样单元28首先基于从空间域信号混合单元25提供的麦克风混合信号SMIX(nS,nT,l)计算以下等式(8),以获得空间区域中的驱动信号DSP(mS,nT,l),其用于使用线性扬声器阵列30再现声场(波前)。也就是说,使用频谱分割方法计算驱动信号DSP(mS,nT,l)。
[公式8]
在本文中,可从以下等式(9)获得等式(8)中的kpw
[公式9]
应注意,在等式(8)中,yref指示SDM的参考距离,以及参考距离yref为准确再现波前的位置。该参考距离yref成为与布置有线性麦克风阵列21的麦克风的方向垂直的方向上的距离。例如,虽然在本文中,参考距离yref=1[m],但是参考距离可为其它值。进一步地,在本实施方案中,忽略倏逝波。
仍进一步地,在等式(8)中,H0 (2)指示汉克尔函数,以及i指示纯虚数。进一步地,mS指示空间频谱标引。仍进一步地,在等式(9)中,c指示声速,以及ω指示时间弧频。
应注意,虽然用于使用SDM计算驱动信号DSP(mS,nT,l)的方法已在本文中被描述为实例,但是可使用其它方法计算驱动信号。进一步地,尤其在“Jens Adrens,Sascha Spors,“Applying the Ambisonics Approach on Planar and Linear Arrays ofLoudspeakers”,in 2nd International Symposium on Ambisonics and SphericalAcoustics”中详细描述了SDM。
随后,空间重采样单元28通过计算以下等式(10)来对空间域中的驱动信号DSP(mS,nT,l)执行空间频率逆变换,以计算时频谱D(nspk,nT,l)。在等式(10)中,将离散傅里叶变换执行为空间频率逆变换。
[公式10]
应注意,在等式(10)中,nspk指示用于指定线性扬声器阵列30中所包括的扬声器的扬声器标引。进一步地,MS指示DFT的点数量,以及i指示纯虚数。
在等式(10)中,将作为空间频谱的驱动信号DSP(mS,nT,l)变换成时频谱,然而驱动信号(麦克风混合信号)也被重采样。具体而言,空间重采样单元28根据线性扬声器阵列30的扬声器的间隔获得线性扬声器阵列30的驱动信号,该驱动信号使得能够通过在空间采样频率下重采样(执行空间频率逆变换)驱动信号而再现实空间中的声场。除非在线性麦克风阵列处采集声场,否则不能执行这种重采样。
空间重采样单元28将以这种方式获得的时频谱D(nspk,nT,l)提供到时频合成单元29。
(时频合成单元)
时频合成单元29通过计算以下等式(11)对从空间重采样单元28提供的时频谱D(nspk,nT,l)执行时频合成,以获得输出帧信号dfr(nspk,nfr,l)。在本文中,虽然将短时傅里叶逆变换(ISTFT)用作时频合成,但是仅需要使用与在时频分析单元22处执行的时频变换的逆变换对应的变换(正变换)。
[公式11]
应注意,可通过以下等式(12)获得等式(11)中的D’(nspk,mT,l)。
[公式12]
在等式(11)中,i指示纯虚数,以及nfr指示时间标引。进一步地,在等式(11)和等式(12)中,MT指示ISTFT的点数量,以及nspk指示扬声器标引。
进一步地,时频合成单元29将所获得的输出帧信号dfr(nspk,nfr,l)乘以窗函数wT(nfr),并且通过执行重叠相加来执行帧合成。例如,通过计算以下等式(13)来执行帧合成,以及获得输出信号d(nspk,t)。
[公式13]
dcurr(nspk,nfr+|Nfr)
=dfr(nspk,nfr,|)WT(nfr)+dprev(nspk,nfr+|Nfr)…(13)
应注意,虽然将与时频分析单元22处使用的窗函数相同的窗函数用作将与输出帧信号dfr(nspk,nfr,l)相乘的窗函数wT(nfr),但是当窗口为诸如Hamming窗的其它窗口时,窗函数可为矩形窗。
进一步地,在等式(13)中,虽然dprev(nspk,nfr+lNfr)和dcurr(nspk,nfr+lNfr)二者指示输出信号d(nspk,t),但是dprev(nspk,nfr+lNfr)指示更新之前的值,以及dcurr(nspk,nfr+lNfr)指示更新之后的值。
时频合成单元29将以这种方式获得的输出信号d(nspk,t)提供到线性扬声器阵列30作为扬声器驱动信号。
(声场再现处理的解释)
接下来将描述由上述声场再现器11执行的处理流。当声场再现器11被指示采集实空间中的声音的波前时,声场再现器11通过采集波前而执行声场再现处理以再现声场。
下文将参考图5的流程图描述由声场再现器11执行的声场再现处理。
在步骤S11中,线性麦克风阵列21采集实空间中的声音的波前,并且将由于声音采集而获得的声音采集信号提供到时频分析单元22。
在本文中,将线性麦克风阵列21-1处获得的声音采集信号提供到时频分析单元22-1,并且将线性麦克风21-2处获得的声音采集信号提供到时频分析单元22-2。
在步骤S12中,时频分析单元22分析从线性麦克风阵列21提供的声音采集信号s(nmic,t)的时频信息。
具体而言,时频分析单元22对声音采集信号s(nmic,t)执行时帧分割,将由于时帧分割获得的输入帧信号sfr(nmic,nfr,l)乘以窗函数wT(nfr),以获得窗函数应用信号sw(nmic,nfr,l)。
进一步地,时频分析单元22对窗函数应用信号sw(nmic,nfr,l)执行时频变换,并且将由于时频变换获得的时频谱S(nmic,nT,l)提供到空间频率分析单元23。也就是说,执行等式(4)的计算,以计算时频谱S(nmic,nT,l)。
在本文中,时频谱S(nmic,nT,l)分别在时频分析单元22-1和时频分析单元22-2处计算,并且被提供到空间频率分析单元23-1和空间频率分析单元23-2。
在步骤S13中,空间频率分析单元23对从时频分析单元22提供的时频谱S(nmic,nT,l)执行空间频率变换,并且将由于空间频率变换而获得的空间频谱SSP(nS,nT,l)提供到空间移位单元24。
具体而言,空间频率分析单元23通过计算等式(5)将时频谱S(nmic,nT,l)变换成空间频谱SSP(nS,nT,l)。换言之,通过在空间采样频率fs S下将时频谱正交地变换成空间频率域来计算空间频谱。
在本文中,空间频谱SSP(nS,nT,l)分别在空间频率分析单元23-1和空间频率分析单元23-2处计算,并且被提供到空间移位单元24-1和空间移位单元24-2。
在步骤S14中,空间移位单元24使从空间频率分析单元23提供的空间频谱SSP(nS,nT,l)空间地移位空间移位量x,并且将由于空间移位获得的空间移位谱SSFT(nS,nT,l)提供到空间域信号混合单元25。
具体而言,空间移位单元24通过计算等式(6)来计算空间移位谱。在本文中,空间移位谱分别在空间移位单元24-1和空间移位单元24-2处计算,并且被提供到空间域信号混合单元25。
在步骤S15中,空间域信号混合单元25混合从空间移位单元24-1和空间移位单元24-2提供的空间移位谱SSFT(nS,nT,l),并且将由于混合获得的麦克风混合信号SMIX(nS,nT,l)提供到通信单元26。
具体而言,必要时,空间域信号混合单元25在对空间移位谱SSFT_i(nS,nT,l)执行补零时计算等式(7),以计算麦克风混合信号。
在步骤S16中,通信单元26通过无线通信将从空间域信号混合单元25提供的麦克风混合信号传输到被放置在再现空间中的声场再现装置42。然后,在步骤S17中,声场再现装置42中提供的通信单元27接收通过无线通信传输的麦克风混合信号,并且将麦克风混合信号提供到空间重采样单元28。
在步骤S18中,空间重采样单元28基于从通信单元27提供的麦克风混合信号SMIX(nS,nT,l)获得空间域中的驱动信号DSP(mS,nT,l)。具体而言,空间重采样单元28通过计算等式(8)计算驱动信号DSP(mS,nT,l)。
在步骤S19中,空间重采样单元28对所获得的驱动信号DSP(mS,nT,l)执行空间频率逆变换,并且将由于空间频率逆变换而获得的时频谱D(nspk,nT,l)提供到时频合成单元29。具体而言,空间重采样单元28通过计算等式(10)将作为时频谱的驱动信号DSP(mS,nT,l)变换成时频谱D(nspk,nT,l)。
在步骤S20中,时频合成单元29对从空间重采样单元28提供的时频谱D(nspk,nT,l)执行时频合成。
具体而言,时频合成单元29通过执行等式(11)的计算而计算来自时频谱D(nspk,nT,l)的输出帧信号dfr(nspk,nfr,l)。进一步地,时频合成单元29通过将输出帧信号dfr(nspk,nfr,l)乘以窗函数wT(nfr)来执行等式(13)的计算,以计算通过帧合成获得的输出信号d(nspk,t)。
时频合成单元29将以这种方式获得的输出信号d(nspk,t)提供到线性扬声器阵列30作为扬声器驱动信号。
在步骤S21中,线性麦克风阵列30基于从时频合成单元29提供的扬声器驱动信号再现声音,并且声场再现处理结束。当基于扬声器驱动信号以这种方式再现声音时,在再现空间中再现实空间中的声场。
如上所述,声场再现器11将多个线性麦克风阵列21处获得的声音采集信号变换成空间频谱,并且必要时,在使空间频谱空间地移位之后混合这些空间频谱,使得中心坐标变得相同。
通过混合多个线性麦克风阵列21获得的空间频谱来获得单个麦克风混合信号,可以更低成本准确地再现声场。也就是说,在这种情况下,通过使用多个线性麦克风阵列21,可在不需要具有高性能但昂贵的线性麦克风阵列的情况下准确地再现声场,使得可抑制声场再现器11的成本。
具体而言,如果将小的线性麦克风阵列用作线性麦克风阵列21,那么可提高声音采集信号的空间频率分辨率,并且如果将具有不同特性的线性麦克风阵列用作多个线性麦克风阵列21,那么可扩大动态范围或频率范围。
进一步地,通过混合多个线性麦克风阵列21获得的空间频谱来获得单个麦克风混合信号,可降低信号的传输成本。仍进一步地,通过重采样麦克风混合信号,可使用包括任意数量的扬声器或在其中以任意间隔布置扬声器的线性扬声器阵列30再现声场。
上述一系列过程可由硬件执行,但也可由软件执行。当所述一系列过程由软件执行时,将构建这种软件的程序安装到计算机中。在本文中,表达“计算机”包括在其中合并有专用硬件的计算机和在安装各种程序时能够执行各种功能的通用个人计算机等。
图6是示出根据程序执行前述一系列过程的计算机的硬件的实例配置的框图。
在计算机中,CPU(中央处理单元)501、ROM(只读存储器)502和RAM(随机存取存储器)503通过总线504互相连接。
还将输入/输出接口505连接到总线504。将输入单元506、输出单元507、记录单元508、通信单元509和驱动器510连接到输入/输出接口505。
从键盘、鼠标、麦克风、成像设备等配置输入单元506。从显示器、扬声器等配置输出单元507。从硬盘、非易失性存储器等配置记录单元508。从网络接口等配置通信单元509。驱动器510驱动可移动介质511,诸如磁盘、光盘、磁光盘、半导体存储器等。
在根据上文所述配置的计算机中,作为一个实例,CPU 501经由输入/输出接口505和总线504将存储在记录单元508中的程序加载到RAM 503中,并且执行程序以进行前述一系列过程。
作为一个实例,由计算机(CPU 501)执行的程序可通过被记录在可移动介质511上作为封装介质等被提供。所述程序还可经由有线或无线传送介质,诸如局域网、互联网或数字卫星广播被提供。
在计算机中,通过将可移动介质511加载到驱动器510中,可经由输入/输出接口505将程序安装到记录单元508。还可使用通信单元509从有线/无线传送介质接收程序,并且将程序安装到记录单元508中。作为另一种替代,可将程序预先安装到ROM 502或记录单元508中。
应注意,由计算机执行的程序可为在其中程序按本说明书中描述的顺序在时间序列中被执行的程序,或可为在其中程序被并行或必要时执行,诸如当程序被调用时。
本公开的实施方案不限于上述实施方案,并且可在不脱离本公开的范围的情况下做出各种改变和修改。
例如,本公开可采取云计算的配置,所述云计算通过由多个装置经由网络来分配并连接一个功能而进行处理。
进一步地,通过上述流程图描述的每个步骤可由一个装置执行或通过分配多个装置来执行。
此外,在一个步骤中包括多个过程的情况下,所述一个步骤包括的所述多个过程可由一个装置执行或通过共享多个装置来执行。
此外,本说明书中描述的影响为非限制性的但仅作为实例,并且可能存在额外影响。
此外,本技术还可如下配置。
(1)一种声场采集装置,其包括:
第一时频分析单元,其被配置为对通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第一时频谱;
第一空间频率分析单元,其被配置为对所述第一时频谱执行空间频率变换,以计算第一空间频谱;
第二时频分析单元,其被配置为对通过包括具有与所述第一特性不同的第二特性的麦克风的第二线性麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第二时频谱;
第二空间频率分析单元,其被配置为对所述第二时频谱执行空间频率变换,以计算第二空间频谱;和
空间域信号混合单元,其被配置为混合所述第一空间频谱和所述第二空间频谱,以计算麦克风混合信号。
(2)根据(1)所述的声场采集装置,其进一步包括:
空间移位单元,其被配置为根据所述第一线性麦克风阵列与所述第二线性麦克风阵列之间的位置关系来使所述第一空间频谱的相位移位,
其中所述空间域混合单元混合所述第二空间频谱和相位被移位的所述第一空间频谱。
(3)根据(1)或(2)所述的声场采集装置,
其中所述空间域信号混合单元对所述第一空间频谱或所述第二空间频谱执行补零,使得所述第一空间频谱的点数量变得与所述第二空间频谱的点数量相同。
(4)根据(1)至(3)中任一项所述的声场采集装置,
其中所述空间域信号混合单元通过使用预定混合系数对所述第一空间频谱和所述第二空间频谱执行权重相加而执行混合。
(5)根据(1)至(4)中任一项所述的声场采集装置,
其中将所述第一线性麦克风阵列和所述第二线性麦克风阵列放置在同一行上。
(6)根据(1)至(5)中任一项所述的声场采集装置,
其中所述第一线性麦克风阵列中所包括的麦克风的数量与所述第二线性麦克风阵列中所包括的麦克风的数量不同。
(7)根据(1)至(6)中任一项所述的声场采集装置,
其中所述第一线性麦克风阵列的长度与所述第二线性麦克风阵列的长度不同。
(8)根据(1)至(7)中任一项所述的声场采集装置,
其中所述第一线性麦克风阵列中所包括的所述麦克风之间的间隔与所述第二线性麦克风阵列中所包括的所述麦克风之间的间隔不同。
(9)一种声场采集方法,其包括下列步骤:
对通过包括具有第一特性的麦克风的第一麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第一时频谱;
对所述第一时频谱执行空间频率变换,以计算第一空间频谱;
对通过包括具有与所述第一特性不同的第二特性的麦克风的第二麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第二时频谱;
对所述第二时频谱执行空间频率变换,以计算第二空间频谱;以及
混合所述第一空间频谱和所述第二空间频谱,以计算麦克风混合信号。
(10)一种促使计算机执行处理的程序,其包括下列步骤:
对通过包括具有第一特性的麦克风的第一麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第一时频谱;
对所述第一时频谱执行空间频率变换,以计算第一空间频谱;
对通过包括具有与所述第一特性不同的第二特性的麦克风的第二麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第二时频谱;
对所述第二时频谱执行空间频率变换,以计算第二空间频谱;以及
混合所述第一空间频谱和所述第二空间频谱,以计算麦克风混合信号。
(11)一种声场再现装置,其包括:
空间重采样单元,其被配置为在线性扬声器阵列确定的空间采样频率下对麦克风混合信号执行空间频率逆变换以计算时频谱,所述麦克风混合信号通过混合从通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号计算出的第一空间频谱和从包括具有与所述第一特性不同的第二特性的麦克风的第二麦克风阵列进行的声音采集获得的声音采集信号计算出的第二空间频谱而获得;和
时频合成单元,其被配置为对所述时频谱执行时频合成,以产生用于通过所述线性扬声器阵列再现声场的驱动信号。
(12)一种声场再现方法,其包括下列步骤:
在线性扬声器阵列确定的空间采样频率下对麦克风混合信号执行空间频率逆变换以计算时频谱,所述麦克风混合信号通过混合从通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号计算出的第一空间频谱和从包括具有与所述第一特性不同的第二特性的麦克风的第二麦克风阵列进行的声音采集获得的声音采集信号计算出的第二空间频谱而获得;以及
对所述时频谱执行时频合成,以产生用于通过所述线性扬声器阵列再现声场的驱动信号。
(13)一种促使计算机执行处理的程序,其包括下列步骤:
在线性扬声器阵列确定的空间采样频率下对麦克风混合信号执行空间频率逆变换以计算时频谱,所述麦克风混合信号通过混合从通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号计算出的第一空间频谱和从包括具有与所述第一特性不同的第二特性的麦克风的第二麦克风阵列进行的声音采集获得的声音采集信号计算出的第二空间频谱而获得;以及
对所述时频谱执行时频合成,以产生用于通过所述线性扬声器阵列再现声场的驱动信号。
参考符号列表
11 声场再现器
21-1,21-2,21 线性麦克风阵列
22-1,22-2,22 时频分析单元
23-1,23-2,23 空间频率分析单元
24-1,24-2,24 空间移位单元
25 空间域信号混合单元
28 空间重采样单元
29 时频合成单元
30 线性扬声器阵列。

Claims (12)

1.一种声场采集装置,其包括:
第一时频分析单元,其被配置为对通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第一时频谱;
第一空间频率分析单元,其被配置为对所述第一时频谱执行空间频率变换,以计算第一空间频谱;
第二时频分析单元,其被配置为对通过包括具有与所述第一特性不同的第二特性的麦克风的第二线性麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第二时频谱;
第二空间频率分析单元,其被配置为对所述第二时频谱执行空间频率变换,以计算第二空间频谱;
空间移位单元,其被配置为根据所述第一线性麦克风阵列与所述第二线性麦克风阵列之间的位置关系来使所述第一空间频谱的相位移位,以使所述第一线性麦克风阵列与所述第二线性麦克风阵列的中心坐标相同,以及
空间域信号混合单元,其被配置为混合所述第二空间频谱和相位被移位的所述第一空间频谱,以计算麦克风混合信号。
2.根据权利要求1所述的声场采集装置,
其中所述空间域信号混合单元对所述第一空间频谱或所述第二空间频谱执行补零,使得所述第一空间频谱的点数量变得与所述第二空间频谱的点数量相同。
3.根据权利要求1所述的声场采集装置,
其中所述空间域信号混合单元通过使用预定混合系数对所述第一空间频谱和所述第二空间频谱执行权重相加而执行混合。
4.根据权利要求1所述的声场采集装置,
其中将所述第一线性麦克风阵列和所述第二线性麦克风阵列放置在同一行上。
5.根据权利要求1所述的声场采集装置,
其中所述第一线性麦克风阵列中所包括的麦克风的数量与所述第二线性麦克风阵列中所包括的麦克风的数量不同。
6.根据权利要求1所述的声场采集装置,
其中所述第一线性麦克风阵列的长度与所述第二线性麦克风阵列的长度不同。
7.根据权利要求1所述的声场采集装置,
其中所述第一线性麦克风阵列中所包括的麦克风之间的间隔与所述第二线性麦克风阵列中所包括的麦克风之间的间隔不同。
8.一种声场采集方法,其包括下列步骤:
对通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第一时频谱;
对所述第一时频谱执行空间频率变换,以计算第一空间频谱;
对通过包括具有与所述第一特性不同的第二特性的麦克风的第二线性麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第二时频谱;
对所述第二时频谱执行空间频率变换,以计算第二空间频谱;
根据所述第一线性麦克风阵列与所述第二线性麦克风阵列之间的位置关系来使所述第一空间频谱的相位移位,以使所述第一线性麦克风阵列与所述第二线性麦克风阵列的中心坐标相同,以及
混合所述第二空间频谱和相位被移位的所述第一空间频谱,以计算麦克风混合信号。
9.一种存储程序的非易失性计算机存储介质,所述程序使计算机执行处理,其包括下列步骤:
对通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第一时频谱;
对所述第一时频谱执行空间频率变换,以计算第一空间频谱;
对通过包括具有与所述第一特性不同的第二特性的麦克风的第二线性麦克风阵列进行的声音采集获得的声音采集信号执行时频变换,以计算第二时频谱;
对所述第二时频谱执行空间频率变换,以计算第二空间频谱;
根据所述第一线性麦克风阵列与所述第二线性麦克风阵列之间的位置关系来使所述第一空间频谱的相位移位,以使所述第一线性麦克风阵列与所述第二线性麦克风阵列的中心坐标相同;以及
混合所述第二空间频谱和相位被移位的所述第一空间频谱,以计算麦克风混合信号。
10.一种声场再现装置,其包括:
空间重采样单元,其被配置为以线性扬声器阵列确定的空间采样频率对麦克风混合信号执行空间频率逆变换,以计算时频谱,所述麦克风混合信号通过以下过程获得:根据通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号计算出第一空间频谱;根据通过包括具有与所述第一特性不同的第二特性的麦克风的第二线性麦克风阵列进行的声音采集获得的声音采集信号计算出第二空间频谱;根据所述第一线性麦克风阵列与所述第二线性麦克风阵列之间的位置关系来使所述第一空间频谱的相位移位,以使所述第一线性麦克风阵列与所述第二线性麦克风阵列的中心坐标相同;以及混合所述第二空间频谱和相位被移位的所述第一空间频谱;和
时频合成单元,其被配置为对所述时频谱执行时频合成,以产生用于通过所述线性扬声器阵列再现声场的驱动信号。
11.一种声场再现方法,其包括下列步骤:
以线性扬声器阵列确定的空间采样频率对麦克风混合信号执行空间频率逆变换,以计算时频谱,所述麦克风混合信号通过以下过程获得:根据通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号计算出第一空间频谱;根据通过包括具有与所述第一特性不同的第二特性的麦克风的第二线性麦克风阵列进行的声音采集获得的声音采集信号计算出第二空间频谱;根据所述第一线性麦克风阵列与所述第二线性麦克风阵列之间的位置关系来使所述第一空间频谱的相位移位,以使所述第一线性麦克风阵列与所述第二线性麦克风阵列的中心坐标相同;以及混合所述第二空间频谱和相位被移位的所述第一空间频谱;以及
对所述时频谱执行时频合成,以产生用于通过所述线性扬声器阵列再现声场的驱动信号。
12.一种存储程序的非易失性计算机存储介质,所述程序使计算机执行处理,其包括下列步骤:
以线性扬声器阵列确定的空间采样频率对麦克风混合信号执行空间频率逆变换,以计算时频谱,所述麦克风混合信号通过以下过程获得:根据通过包括具有第一特性的麦克风的第一线性麦克风阵列进行的声音采集获得的声音采集信号计算出第一空间频谱;根据通过包括具有与所述第一特性不同的第二特性的麦克风的第二线性麦克风阵列进行的声音采集获得的声音采集信号计算出第二空间频谱;根据所述第一线性麦克风阵列与所述第二线性麦克风阵列之间的位置关系来使所述第一空间频谱的相位移位,以使所述第一线性麦克风阵列与所述第二线性麦克风阵列的中心坐标相同;以及混合所述第二空间频谱和相位被移位的所述第一空间频谱;以及
对所述时频谱执行时频合成,以产生用于通过所述线性扬声器阵列再现声场的驱动信号。
CN201580011901.3A 2014-03-12 2015-02-27 声场声音拾取装置和方法、声场再现装置和方法以及程序 Active CN106105261B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014-048428 2014-03-12
JP2014048428 2014-03-12
PCT/JP2015/055742 WO2015137146A1 (ja) 2014-03-12 2015-02-27 音場収音装置および方法、音場再生装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
CN106105261A CN106105261A (zh) 2016-11-09
CN106105261B true CN106105261B (zh) 2019-11-05

Family

ID=54071594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580011901.3A Active CN106105261B (zh) 2014-03-12 2015-02-27 声场声音拾取装置和方法、声场再现装置和方法以及程序

Country Status (4)

Country Link
US (1) US10206034B2 (zh)
JP (1) JP6508539B2 (zh)
CN (1) CN106105261B (zh)
WO (1) WO2015137146A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3188504B1 (en) 2016-01-04 2020-07-29 Harman Becker Automotive Systems GmbH Multi-media reproduction for a multiplicity of recipients
EP3400722A1 (en) * 2016-01-04 2018-11-14 Harman Becker Automotive Systems GmbH Sound wave field generation
WO2019142372A1 (ja) * 2018-01-22 2019-07-25 ラディウス株式会社 受信方法、受信装置、送信方法、送信装置、送受信システム
US10522167B1 (en) * 2018-02-13 2019-12-31 Amazon Techonlogies, Inc. Multichannel noise cancellation using deep neural network masking
CN112567769B (zh) * 2018-08-21 2022-11-04 索尼公司 音频再现装置、音频再现方法和存储介质
US10547940B1 (en) * 2018-10-23 2020-01-28 Unlimiter Mfa Co., Ltd. Sound collection equipment and method for detecting the operation status of the sound collection equipment
WO2020241050A1 (ja) * 2019-05-28 2020-12-03 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
CN116582792B (zh) * 2023-07-07 2023-09-26 深圳市湖山科技有限公司 一种无束缚远近场自由可控的音响装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101406074A (zh) * 2006-03-24 2009-04-08 杜比瑞典公司 根据多通道信号的参数表示产生空间缩混
CN101852846A (zh) * 2009-03-30 2010-10-06 索尼公司 信号处理设备、信号处理方法和程序
CN102036158A (zh) * 2009-10-07 2011-04-27 株式会社日立制作所 声响监视***及声音集音***
CN102306496A (zh) * 2011-09-05 2012-01-04 歌尔声学股份有限公司 一种多麦克风阵列噪声消除方法、装置及***
CN102421050A (zh) * 2010-09-17 2012-04-18 三星电子株式会社 使用麦克风的非均匀布局来增强音频质量的设备和方法
CN102682765A (zh) * 2012-04-27 2012-09-19 中咨泰克交通工程集团有限公司 高速公路音频车辆检测装置及其方法
CN102763160A (zh) * 2010-02-18 2012-10-31 高通股份有限公司 用于稳健噪声降低的麦克风阵列子组选择
JP2013150027A (ja) * 2012-01-17 2013-08-01 Nippon Telegr & Teleph Corp <Ntt> 音場収音再生装置、方法及びプログラム
JP2014021315A (ja) * 2012-07-19 2014-02-03 Nippon Telegr & Teleph Corp <Ntt> 音源分離定位装置、方法、及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8934640B2 (en) * 2007-05-17 2015-01-13 Creative Technology Ltd Microphone array processor based on spatial analysis
US8701491B2 (en) * 2008-04-25 2014-04-22 Stichting Voor De Technische Wetenschapen Acoustic holography

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101406074A (zh) * 2006-03-24 2009-04-08 杜比瑞典公司 根据多通道信号的参数表示产生空间缩混
CN101852846A (zh) * 2009-03-30 2010-10-06 索尼公司 信号处理设备、信号处理方法和程序
CN102036158A (zh) * 2009-10-07 2011-04-27 株式会社日立制作所 声响监视***及声音集音***
CN102763160A (zh) * 2010-02-18 2012-10-31 高通股份有限公司 用于稳健噪声降低的麦克风阵列子组选择
CN102421050A (zh) * 2010-09-17 2012-04-18 三星电子株式会社 使用麦克风的非均匀布局来增强音频质量的设备和方法
CN102306496A (zh) * 2011-09-05 2012-01-04 歌尔声学股份有限公司 一种多麦克风阵列噪声消除方法、装置及***
JP2013150027A (ja) * 2012-01-17 2013-08-01 Nippon Telegr & Teleph Corp <Ntt> 音場収音再生装置、方法及びプログラム
CN102682765A (zh) * 2012-04-27 2012-09-19 中咨泰克交通工程集团有限公司 高速公路音频车辆检测装置及其方法
JP2014021315A (ja) * 2012-07-19 2014-02-03 Nippon Telegr & Teleph Corp <Ntt> 音源分離定位装置、方法、及びプログラム

Also Published As

Publication number Publication date
CN106105261A (zh) 2016-11-09
US10206034B2 (en) 2019-02-12
JP6508539B2 (ja) 2019-05-08
US20170070815A1 (en) 2017-03-09
WO2015137146A1 (ja) 2015-09-17
JPWO2015137146A1 (ja) 2017-04-06

Similar Documents

Publication Publication Date Title
CN106105261B (zh) 声场声音拾取装置和方法、声场再现装置和方法以及程序
US10382849B2 (en) Spatial audio processing apparatus
CN104170408B (zh) 应用组合的或混合的声场控制策略的方法
JP5773540B2 (ja) 記録された音場の再構築
CN108370487B (zh) 声音处理设备、方法和程序
JP6458738B2 (ja) 音場再現装置および方法、並びにプログラム
CN107071685A (zh) 用于渲染音频声场表示以供音频回放的方法和设备
CN104769968B (zh) 音频呈现***
CN109417678A (zh) 声场形成装置和方法以及程序
CN106797526B (zh) 音频处理装置、方法和计算机可读记录介质
WO2015159731A1 (ja) 音場再現装置および方法、並びにプログラム
US20170325026A1 (en) Signal processing device, signal processing method, and program
Belloch et al. GPU-based dynamic wave field synthesis using fractional delay filters and room compensation
WO2018053050A1 (en) Audio signal processor and generator
Thiergart et al. Parametric spatial sound processing using linear microphone arrays
JP6592838B2 (ja) バイノーラル信号生成装置、方法及びプログラム
CN110637466B (zh) 扬声器阵列与信号处理装置
JP5713964B2 (ja) 音場収音再生装置、方法及びプログラム
JPH09146443A (ja) 近距離音場ホログラフィー装置
CN114662663B (zh) 虚拟听觉***的声音播放数据获取方法和计算机设备
JP2024098908A (ja) 音場再現装置及びプログラム
JP2017112415A (ja) 音場推定装置、その方法及びプログラム
WO2023000088A1 (en) Method and system for determining individualized head related transfer functions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant