CN105812991B

CN105812991B - 音频信号处理设备

Info

Publication number: CN105812991B
Application number: CN201610036844.0A
Authority: CN
Inventors: 汤山雄太; 青木良太郎; 加纳真弥
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2015-01-20
Filing date: 2016-01-20
Publication date: 2019-02-26
Anticipated expiration: 2036-01-20
Also published as: EP3048818A1; US20160212563A1; EP3048818B1; US9883317B2; CN105812991A

Abstract

本发明公开了一种音频信号处理设备，该音频信号处理设备包括：输入单元，其配置为接收多个通道的音频信号的输入；获得单元，其配置为获得声源的位置信息；声场效果声产生单元，其配置为通过将声场效果单独地赋予各通道中的每一个的音频信号产生声场效果声；以及控制单元，其配置为基于位置信息控制将在声场效果声产生单元中赋予的声场效果。

Description

音频信号处理设备

技术领域

本发明的一些优选实施例涉及对音频信号执行各种处理的音频信号处理设备。

背景技术

按照常规，在收听环境中形成期望声场的声场支持装置是已知的(例如，见JP2001-186599A)。声场支持装置通过对多个通道的音频信号进行组合以及将预定参数与组合的音频信号进行卷积来产生伪反射声(声场效果声)。

另一方面，近年来，已广泛使用利用赋予内容的对象信息的声像定位方法。对象信息包括指示对象的位置的信息。对象是对应于利用对象信息的声像定位方法中的“声源”的术语。

然而，对于利用对象信息的声像定位方法而言，还没有优化声场效果。例如，由于在声源的类型是诸如语音的声音的情况下优选地减小声场效果，因此往往含有大量诸如音乐的成分的前信号或周围信号具有高贡献率，而往往含有大量诸如语音的成分的中心信号具有低贡献率。

在这种状态下，在对象从前至后运动的情况下，例如，随着对象的声像定位位置从前变化到后，在一些情况下，声场效果会显著增大。

此外，在利用对象信息的声像定位方法中，仅输入已基于收听环境(扬声器排列模式)进行通道分布的音频信号，并且在其它情况下可不获得原始对象的位置信息本身。

此外，在其中在例如小演奏厅中记录内容并且将作为收听环境的大演奏厅的声场效果设为赋予内容的情况下，间接声散播开而直接声(各个声源)的位置未改变。

鉴于以上内容，本发明的一些优选实施例涉及提供一种针对各个对象形成最优声场的音频信号处理设备。

另外，本发明的其它优选实施例致力于提供一种对内容中包含的对象的位置信息进行估计的音频信号处理设备。

此外，本发明的一些其它优选实施例致力于提供一种赋予合适的声像位置的音频信号处理设备。

发明内容

根据本发明的优选实施例的音频信号处理设备包括：输入单元，其配置为接收包含多个通道的音频信号的内容的输入；获得单元，其配置为获得所述内容中包含的声源的位置信息；以及声场效果声产生单元，其配置为通过将声场效果单独地赋予各通道中的每一个的音频信号来产生声场效果声。

然后，所述音频信号处理设备还包括控制单元，其配置为基于位置信息控制将在声场效果声产生单元中赋予的声场效果。

例如，声场效果声产生单元通过根据位置信息的单独的滤波系数与通道中的每一个的音频信号进行卷积来赋予声场效果。作为另外一种选择，声场效果声产生单元可优选地通过以预定增益对各通道的音频信号进行组合来产生声场效果声，并且控制单元可优选地基于位置信息来控制声场效果声产生单元中的各通道中的每一个的增益。

音频信号处理设备不固定对各通道中的每一个的声场效果声的贡献率而是根据对象位置的改变来动态地设置各通道中的每一个的贡献率，从而产生对应于对象的移动的最佳声场效果声。

例如，在对象位于收听位置前方的情况下，前通道的贡献率设为高，并且随着对象向后移动，前通道的贡献率设为低，并且周围通道的贡献率设为高。因此，即使对象的声像定位位置从前改变至后，声效也不会显著增加。

根据本发明的优选实施例，可针对各个对象形成最佳声场。

本发明的以上和其它元件、特征、步骤、特性和优点将从以下参照附图对优选实施例的详细说明中变得更加清楚。

附图说明

图1是示出收听环境的框架格式的示图。

图2是根据第一优选实施例的音频信号处理设备的框图。

图3是DSP和CPU的功能构造的框图。

图4是根据第一优选实施例的修改示例的DSP的功能构造的框图。

图5是根据第二优选实施例的修改示例的DSP的功能构造的框图。

图6A和图6B是示出各通道之间的相关性的示图。图6C是示出根据第二优选实施例的收听环境的框架格式的示图。

图7是根据第一优选实施例(或第二优选实施例)的第一修改示例的音频信号处理单元14的功能构造的框图。

图8A和图8B是示出根据第三优选实施例的收听环境的框架格式的示图。

图9是根据第三优选实施例的音频信号处理设备的框图。

图10是示出音频信号处理设备的操作的流程图。

图11是示出音频信号处理设备的操作的流程图。

图12是示出音频信号处理设备的操作的流程图。

图13是示出音频信号处理设备的操作的流程图。

图14是根据应用示例的音频信号处理设备的框图。

具体实施方式

第一优选实施例

本发明的第一优选实施例涉及一种音频信号处理设备，该音频信号处理设备包括：输入单元，其配置为接收包含多个通道的音频信号的内容的输入；获得单元，其配置为获得在所述内容中包含的声源的位置信息；声场效果声产生单元，其配置为通过将声场效果单独地赋予各通道中的每一个的音频信号来产生声场效果声；和控制单元，其配置为基于位置信息控制将要在声场效果声产生单元中赋予的声场效果。

应该注意，声场效果声产生单元可优选地包括第一声场效果声产生单元和第二声场效果声产生单元，第一声场效果声产生单元可基于预定参数优选地执行通过将声场效果单独地赋予各通道中的每一个的音频信号而产生声场效果声的处理，并且第二声场效果声产生单元可基于控制单元的控制优选地执行将声场效果单独地赋予各通道中的每一个的音频信号的处理。

在这种情况下，在如同常规技术中那样产生通过固定各通道中的每一个的贡献率获得的声场效果声的同时，产生了通过设置与各个对象的位置相对应的最佳贡献率获得的声场效果声。

另外，获得单元可优选地获得每个波段的声源的位置信息，并且控制单元可优选地基于每个波段的声源的位置信息设置声场效果声产生单元中的参数。

例如，就其主要成分处于低频带中的对象而言，利用针对该低频带准备的参数(滤波器系数)产生声场效果声。

而且，获得单元还可获得指示声源的类型的信息，并且控制单元还可基于指示声源的类型的信息优选地针对声源的类型设置不同的增益。

例如，在其中对象是语音的情况下，对应于语音对象的通道的贡献率保持为低。因此，例如，即使内容包括从前至后运动的扬声器，扬声器的声音也不会不必要地共振，并且可形成合适声场。

图1是示出根据第一优选实施例的收听环境的框架格式的示图，图2是根据第一优选实施例的音频信号处理设备1的框图。在第一优选实施例中，在平面图为方形形状的房间中的示例示出了其中房间的中心位置是收听位置的收听环境。在收听位置周围，安装了多个扬声器(在该示例中，五个扬声器：扬声器21L、扬声器21R、扬声器21C、扬声器21SL和扬声器21SR)。扬声器21L安装在收听位置的左前侧上，扬声器21R安装在收听位置的右前侧上，扬声器21C安装在收听位置的前方中心，扬声器21SL安装在收听位置的左后侧上，并且扬声器21SR安装在收听位置的右后侧上。扬声器21L、扬声器21R、扬声器21C、扬声器21SL和扬声器21SR单独地连接至音频信号处理设备1。

音频信号处理设备1包括输入单元11、解码器12、渲染器13、音频信号处理单元14、D/A转换器15、放大器(AMP)16、CPU 17、ROM 18和RAM 19。

CPU 17将存储在ROM 18中的操作程序(固件)读出至RAM 19并且集中控制音频信号处理设备1。

输入单元11具有诸如HDMI(注册商标)的接口。输入单元11从播放器等接收内容数据的输入，并且将数据输出至解码器12。应该注意，输入单元11不仅可接收内容数据的输入，而且可接收数字音频信号或模拟音频信号的输入。输入单元11在接收模拟音频信号的输入的情况下将模拟音频信号转换为数字音频信号。

解码器12例如是解码内容数据并从内容数据中提取音频信号的DSP。解码器12在从输入单元11接收数字音频信号的输入的情况下，将数字音频信号按原样输出至在后续阶段设置的渲染器13。应该注意，在当前优选实施例中，除非另有说明，否则将音频信号全部描述为数字音频信号。

解码器12在其中在基于对象的***中支持输入内容数据的情况下提取对象信息。基于对象的***存储包含在内容中的对象(声源)作为单独音频信号。在基于对象的***中，在后续阶段中设置的渲染器13将对象的音频信号分配给各通道中的每一个的音频信号，以(在各个对象中)执行声像定位处理。因此，对象信息包括诸如各个对象的位置信息和等级(level)的信息。

渲染器13是例如DSP，并且基于对象信息中包含的各个对象的位置信息执行声像定位处理。换句话说，渲染器13以预定增益将从解码器12输出的各个对象的音频信号分配给各通道中的每一个的音频信号，以将声像定位在对应于各个对象的位置信息的位置。按照这种方式，产生基于通道的***的音频信号。各通道中的每一个的产生的音频信号输出至音频信号处理单元14。

音频信号处理单元14是例如DSP，并且根据CPU 17的设置执行将预定声场效果赋予各通道中的每一个的输入音频信号的处理。

例如，声场效果包括将从输入音频信号产生的伪反射声。

将产生的伪反射声添加至原始音频信号并输出。

图3是音频信号处理单元14和CPU 17的功能构造的框图。在功能上，音频信号处理单元14包括加法处理单元141、声场效果声产生单元142和加法处理单元143。

加法处理单元141以预定增益对各通道的音频信号进行组合，并且将各个音频信号缩混为单声道信号。通过包括在CPU 17中的控制单元171设置各通道中的每一个的增益。通常，由于声场效果在其中声源的类型是诸如语音的声音的情况下优选地减小，因此将往往包含大量诸如音乐的成分的前通道或周围通道的增益设为高，而将往往含有大量诸如语音的成分的中心通道的增益设为低。

声场效果声产生单元142是例如FIR滤波器，并且通过将指示预定脉冲响应的参数(滤波器系数)与输入音频信号卷积而产生伪反射声。另外，声场效果声产生单元142执行将产生的伪反射声分配至各通道中的每一个的处理。通过包括在CPU 17中的控制单元171设置滤波器系数和分配比率。

在功能上，CPU 17包括控制单元171和对象信息获得单元172。控制单元171基于存储在ROM 18中的声场效果信息而为声场效果声产生单元142设置滤波器系数、针对各通道中的每一个的分配比率等。

声场效果信息包括在声学空间中产生的一组反射声的脉冲响应和指示该组反射声的声源的位置的信息。例如，以可在收听位置的左侧上产生伪反射声的预定延迟量和预定增益比率(例如1:1)向扬声器21L和扬声器21SL供应音频信号。声场效果信息包括用于在前方上侧上产生声场的当前声场(presence sound effect)的设置和用于在周围侧产生声场的周围声场的设置。将被选择的声场效果信息可固定为音频信号处理设备1中的一条信息，或者在用户期望和指定诸如电影院或演奏厅的声学空间以使得所述由用户指定的声学空间可被接收之后，可选择对应于接收到的声学空间的声场效果信息。

如上所述，产生声场效果声并将其添加至加法处理单元141中的各通道中的每一个。然后，各通道中的每一个的音频信号在D/A转换器15中转换为模拟信号，并且在被放大器16放大之后输出至各扬声器中的每一个。因此，在收听位置周围形成模仿诸如演奏厅的预定声学空间的声场。

然后，根据优选实施例的音频信号处理设备1使得对象信息获得单元172获得通过解码器12提取的对象信息并且针对各个对象形成最佳声场。控制单元171基于包含在通过对象信息获得单元172获得的对象信息中的位置信息设置加法处理单元141的各通道中的每一个的增益。因此，控制单元171控制声场效果声产生单元142中的各通道中的每一个的增益。

一个示例假设对象在时间t＝1位于收听位置前方，该对象在时间t＝2移动靠近收听位置并且在时间t＝3移动到收听位置后方。在时间t＝1，控制单元171将前通道的增益设为最大值，并且将加法处理单元141的周围通道的增益设为最小值。在时间t＝2，控制单元171将加法处理单元141的前通道的增益和周围通道的增益设为大约彼此相等。然后，在时间t＝3，控制单元171将加法处理单元141的周围通道的增益设为最大值，并且将前通道的增益设为最小值。

按照这种方式，音频信号处理设备1使得对应于移动对象的加法处理单元141的各通道中的每一个的增益动态地改变，因此可导致形成的声场动态地改变。因此，收听者可获得改进的三维声场效果。

应该注意，虽然当前优选实施例为了使说明更易于理解而示出了其中安装有五个扬声器(扬声器21L、扬声器21R、扬声器21C、扬声器21SL和扬声器21SR)并对五个通道的音频信号进行处理的示例，但是扬声器的数量和通道的数量不限于该示例。实际上，更大数量的扬声器可优选地安装在不同高度的位置，以实现三维声像定位和声场效果。

应该注意，虽然在上述示例中通过基于获得的位置信息将各通道的音频信号与增益进行组合以及对指示预定脉冲响应的参数(滤波器系数)与音频信号进行卷积来执行产生伪反射声的处理，但是可通过对单独的滤波器系数与各通道中的每一个的音频信号进行卷积来执行赋予声场效果的处理。在这种情况下，ROM 18存储对应于对象位置的多个滤波器系数，并且控制单元171基于获得的位置信息从ROM 18中读取对应的滤波器系数并且为声场效果声产生单元142设置滤波器系数。另外，控制单元171可以执行以下处理：基于获得的位置信息对各通道的音频信号与增益进行组合，基于获得的位置信息从ROM 18读取对应的滤波器系数，以及为声场效果声产生单元142设置滤波器系数。

图10是示出音频信号处理设备的操作的流程图。首先，音频信号处理设备接收音频信号的输入(S11)。如上所述，在其中输入单元11从播放器等接收内容数据的输入的情况下，解码器12解码内容数据并且提取音频信号。输入单元11在接收模拟音频信号的输入的情况下将模拟音频信号转换为数字音频信号。然后，音频信号处理设备获得位置信息(对象信息)(S12)并且通过将声场效果单独地赋予各通道中的每一个的音频信号来产生声场效果声(S13)。然后，音频信号处理设备基于获得的位置信息通过设置各通道中的每一个的增益来控制声场效果(S14)。

第二优选实施例

本发明的第二优选实施例涉及一种音频信号处理设备，该音频信号处理设备包括：输入单元，其配置为接收多个通道的音频信号的输入；相关(correlation)检测单元，其配置为检测通道之间的相关成分；以及获得单元，其配置为基于通过相关检测单元检测的相关成分来获得声源的位置信息。

图4是根据第二优选实施例的音频信号处理设备1B的构造的框图。相似的标号用于指示与根据图2所示的第一优选实施例的音频信号处理设备1相同的部件，并且省略其描述。另外，根据第二优选实施例的收听环境与根据图1所示的第一优选实施例的收听环境相似。

音频信号处理设备1B包括：音频信号处理单元14，除图3所示的功能以外，其还包括分析单元91的功能。实际上，分析单元91被实现为不同的硬件项目(DSP)，但是在第二优选实施例中，为了达到说明的目的，假设分析单元91被实现为音频信号处理单元14的功能。而且，可通过由CPU 17执行的软件来实现分析单元91。

分析单元91通过分析各通道中的每一个的音频信号，提取被包含在内容中的对象信息。换句话说，在其中CPU 17未从解码器12获得(或不能获得)对象信息的情况下，根据第二优选实施例的音频信号处理设备1B通过分析各通道中的每一个的音频信号来估计对象信息。

图5是分析单元91的功能构造的框图。分析单元91包括波段划分单元911和计算单元912。波段划分单元911将各通道中的每一个的音频信号的波段划分为预定频带。该示例示出了频带被划分为三个波段：低频带(LPF)、中间频带(BPF)和高频带(HPF)。然而，待划分的波段不限于这三个频带。各通道中的每一个的划分的音频信号被输入至计算单元912。

计算单元912在划分的波段中的每一个中计算各通道之间的互相关值。将计算的互相关值输入至CPU 17的对象信息获得单元172。另外，计算单元912还用作等级检测单元，其配置为检测各通道中的每一个的音频信号的等级。各通道中的每一个的音频信号的等级信息也被输入至对象信息获得单元172。

对象信息获得单元172基于输入相关值和各通道中的每一个的音频信号的等级信息来评价对象的位置。

例如，在如图6A所示的低频带(Low)中的L通道与SL通道之间的相关值大(超过预定阈值)以及如图6B所示的低频带(Low)中的L通道和SL通道的等级高(超过预定阈值)的情况下，则如图6C所示，假设对象存在于扬声器21L与扬声器21SL之间。

而且，在高频带(High)中不存在高相关性的通道时，在中间频带(Mid)的C通道中输入高等级的音频信号。因此，如图6C所示，假设存在靠近扬声器21C的另一对象。

在这种情况下，对于将要为如图3所示的加法处理单元141设置的增益，控制单元171将L通道的增益和SL通道的增益设为大约彼此相等(0.5:0.5)，并且将C通道的增益设为最大值(1)。将其它通道的增益设为最小值。因此，产生了已为其设置与各个对象的位置相对应的最佳贡献率的声场效果声。

然而，由于C通道中的高等级信号有可能涉及诸如语音的声音，因此控制单元171可通过同时参照关于各个对象的类型的信息的方式优选地设置增益。下面将描述关于对象的类型的信息。

另外，在这种情况下，控制单元171可优选地从ROM 18中读取针对各波段中的每一个设置的声场效果信息，并且可优选地针对声场效果声产生单元142的各波段中的每一个设置单独的参数(滤波器系数)。例如，混响时间在低频带中设为短而在高频带中设为长。

应该注意，随着通道的数量加法，可更正确地估计对象的位置。虽然该示例示出了各扬声器中的每一个排列在相同高度并且计算五个通道的音频信号的相关值，但是在实际上，可将更多数量的扬声器优选地安装在不同高度的位置，以实现三维声像定位和声场效果，并且计算更多数量的通道之间的相关值，从而可以几乎唯一地确定声源的位置。

应该注意，虽然当前优选实施例示出了其中针对各波段中的每一个划分各通道中的每一个的音频信号并且针对各波段中的每一个获得对象的位置信息的示例，但是在其中针对各波段中的每一个获得对象的位置信息的这种构造对于本发明不是必要的。

第一修改示例

接着，图7是根据第一优选实施例(或第二优选实施例)的第一修改示例的音频信号处理单元14的功能构造的框图。根据第一修改示例的音频信号处理单元14包括加法处理单元141A、第一声场效果声产生单元142A、加法处理单元141B、第二声场效果声产生单元142B和加法处理单元143。应该注意，虽然加法处理单元141B和第二声场效果声产生单元142B在实际中配置为不同的硬件(DSP)项目，但是为了描述，该示例示出了假设加法处理单元141B和第二声场效果声产生单元142B中的每一个被实现为音频信号处理单元14的功能。

加法处理单元141A以预定增益对各通道的音频信号进行组合并且将组合的音频信号混合为单声道信号。各通道中的每一个的增益是固定的。例如，如上所述，前通道或周围通道的增益设为高，而中心通道的增益设为低。

第一声场效果声产生单元142A通过对指示预定脉冲响应的参数(滤波器系数)与输入音频信号进行卷积产生伪反射声。另外，第一声场效果声产生单元142A执行将产生的伪反射声分配至各通道中的每一个的处理。通过控制单元171设置滤波器系数和分配比率。按照与图3的示例中的方式相同的方式，在用户期望和指定诸如电影院或演奏厅的声学空间以使得用户指定的声学空间可被接收之后，可选择对应于接收的声学空间的声场效果信息。

另一方面，控制单元171基于包含在通过对象信息获得单元172获得的对象信息中的位置信息来设置加法处理单元141B的各通道中的每一个的增益。因此，控制单元171控制第二声场效果声产生单元142B中的各通道中的每一个的增益。

第一声场效果声产生单元142A中产生的声场效果声和第二声场效果声产生单元142B中产生的声场效果声各自添加至加法处理单元143中的各通道中的每一个的音频信号。

因此，根据第一修改示例的音频信号处理单元14在如常规方式那样产生通过固定各通道中的每一个的贡献率获得的声场效果声的同时，产生通过设置与各对象的位置对应的最佳贡献率获得的声场效果声。

第二修改示例

接着，将描述根据第一优选实施例(或第二优选实施例)的第二修改示例的音频信号处理设备。根据第二修改示例的音频信号处理单元14和CPU 17包括与如图3所示构造(或者如图7所示的构造)相似的功能构造。然而，根据第二修改示例的对象信息获得单元172除位置信息以外获得指示对象的类型的信息作为对象信息。

指示对象的类型的信息是指示诸如语音、乐器和效果声的声源的类型的信息。指示对象的类型的信息在被包含在内容数据中的情况下由解码器12提取，并且可通过包括在分析单元91中的计算单元912进行估计。

例如，包括在分析单元91中的波段划分单元911从输入音频信号中提取第一共振峰的频带(200Hz至500Hz)和第二共振峰的频带(2kHz至3kHz)。如果输入信号成分包括大量关于语音的成分或者仅包括关于语音的成分，则更多数量的第一共振峰和第二共振峰的成分被包括在所述频带中而非其它频带中。

因此，在其中与整个频带的平均等级相比第一共振峰或第二共振峰的成分等级高的情况下，对象信息获得单元172确定对象的类型是语音。

控制单元171基于对象的类型设置加法处理单元141(或加法处理单元141B)的增益。例如，如图6C所示，在其中对象位于收听位置的左侧并且对象的类型是语音的情况下，L通道和SL通道的增益设为低。作为另外一种选择，如图6C所示，在其中对象在收听位置前方而对象的类型是语音的情况下，C通道的增益设为低。

第三修改示例

作为第二优选实施例的第三修改示例，利用估计的对象位置信息，音频信号处理设备1B可使得显示单元92显示对象的位置。因此，用户可在视觉上抓住对象的运动。就诸如电影的内容而言，显示单元在许多情况下已经显示对象的副本作为图像，并且显示的图像是主观视图。因此，音频信号处理设备1B可显示对象的位置来作为俯视图，该俯视图的中心例如是所述音频信号处理设备1B的位置。

图11是示出音频信号处理设备的操作的流程图。首先，音频信号处理设备接收音频信号的输入(S21)。然后，计算单元912检测各通道之间的相关成分(S22)。音频信号处理设备基于检测到的相关成分获得位置信息(S23)。音频信号处理设备通过将声场效果单独地赋予各通道中的每一个的音频信号来产生声场效果声(S23)。

第三优选实施例

本发明的第三优选实施例涉及一种音频信号处理设备，该音频信号处理设备包括：输入单元，其配置为接收多个通道的音频信号的输入；获得单元，其配置为获得声源的位置信息；声像定位处理单元，其配置为基于位置信息执行声源的声像定位；接收单元，其配置为接收改变命令，以改变收听环境；以及控制单元，其配置为根据已被接收单元接收的改变命令控制声像定位处理单元的声像位置。

图8A和图8B是示出根据第三优选实施例的收听环境的框架格式的示图，图9是根据第三优选实施例的音频信号处理设备1C的框图。根据第三优选实施例的音频信号处理设备1C包括与图2所示的音频信号处理设备1的硬件构造相似的硬件构造，并且还包括作为接收单元的用户接口(I/F)81。

用户I/F 81是一种从用户接收操作的接口并且包括安装在音频信号处理设备的壳体、触摸面板或遥控器上的开关。用户指定期望的声学空间作为改变命令，以通过用户I/F 81改变收听环境。

CPU 17的控制单元171接收声学空间的规格并且从ROM 18读取对应于指定的声学空间的声场效果信息。然后，控制单元171基于声场效果信息、各通道中的每一个的分配比率等针对音频信号处理单元14设置滤波器系数。

此外，控制单元171通过将在对象信息获得单元172中获得的对象的位置信息转换为对应于读出的声场效果信息的位置并且将转换的位置信息输出至渲染器13来对所述对象进行再排列。

换句话说，例如，控制单元171在接收大演奏厅的声学空间的规格的情况下，将对象再排列至远离收听位置的位置，以将各个对象再排列至对应于大演奏厅的规模的位置。渲染器13基于从控制单元171输入的位置信息执行声像定位处理。

例如，如图8A所示，在其中对象51R排列在收听位置的右前侧上而对象51L排列在收听位置的左前侧上的情况下，如图8B所示，控制单元171在接收大演奏厅的声学空间的规格的情况下将对象51R和对象51L再排列至远离收听位置的位置。因此，所选择的声学空间的声场环境和对应于直接声的声源的位置都可更靠近实际声学空间。

控制单元171还将对象的移动转换为对应于所选择的声学空间的规模的移动量。例如，在舞台表演和类似场合中，演员在动态移动的同时说话。例如，控制单元171在接收大演奏厅的声学空间的规格的情况下，使得在解码器12中提取的对象的移动量更大，并且将对应于演员的对象的位置再排列。这允许听众体验如同演员当场表演一样的存在感和真实感。

另外，用户I/F 81可接收收听位置的规格作为改变命令以改变收听环境。用户在选择大会堂作为声学空间之后，例如，还选择会堂中的收听位置，诸如舞台正前方的位置、第二排座位(从斜上侧俯视舞台的位置)和远离舞台并靠近出口位置。

控制单元171根据指定的收听位置再排列各个对象。例如，在其中指定位于舞台正前方的位置的收听位置的情况下，控制单元171将对象再排列至靠近收听位置的位置，并且，在其中指定位于远离舞台的位置的收听位置的情况下，将对象再排列至远离收听位置的位置。另外，例如，在其中指定第二层座位的位置(从斜上侧俯视舞台的位置)作为收听位置的情况下，控制单元171将对象再排列至从收听者角度观看的倾斜位置。

而且，控制单元171在接收收听位置的规格的情况下可优选地测量各个位置(间接声的到达定时和方向)的实际声场，并且可优选地将声场作为声场效果信息存储在ROM 18中。控制单元171从ROM 18中读取对应于指定的收听位置的声场效果信息。这可再现位于舞台正前方的位置的声场、位于远离舞台的位置的声场等。

应该注意，在实际声学空间中不需要在所有位置测量声场效果信息。例如，在舞台正前方的位置直接声增大，并且在远离舞台的位置间接声增大。因此，例如，在其中选择在会堂中心的收听位置的情况下，也可通过对与在舞台正前方的位置的测量结果相对应的声场效果信息和与在远离舞台的位置的测量结果相对应的声场效果信息取平均来对与会堂中心的收听位置相对应的声场效果信息进行插值。

应用示例

图14是根据应用示例的音频信号处理设备1D的框图。根据应用示例的音频信号处理设备1D利用安装在收听者佩戴的终端中的诸如回转仪传感器的方向检测单元173来获得关于收听者面对的方向的信息。控制单元171根据收听者面对的方向将各个对象再排列。

例如，控制单元171在其中收听者面对右侧的情况下将对象再排列至从收听者角度观看的左侧的位置。

另外，根据应用示例的音频信号处理设备1D的ROM 18存储针对各个方向的声场效果信息。控制单元171根据收听者面对的方向从ROM 18读取声场效果信息，并且为音频信号处理单元14设置声场效果信息。这允许收听者获得如同收听者在现场的真实感。

图12是示出音频信号处理设备的操作的流程图。首先，音频信号处理设备接收音频信号的输入(S31)。如上所述，在其中输入单元11从播放器等接收内容数据的输入的情况下，解码器12将内容数据解码，并且提取音频信号。输入单元11在接收模拟音频信号的输入的情况下，将模拟音频信号转换为数字音频信号。然后，音频信号处理设备获得位置信息(对象信息)(S32)。渲染器13执行声像定位处理(S33)。然后，在其中用户I/F 81接收改变指令以改变收听环境(S34)的情况下，控制单元171通过将在S32的处理中获得的位置信息输出至渲染器13来控制声像定位位置(S35)。

应该注意，可合适地组合上面已经描述的第一优选实施例、第二优选实施例和第三优选实施例。例如，如图13所示，音频信号处理设备在基于位置信息执行声场效果的控制(S14)的同时，也可基于位置信息执行声像定位位置的控制(S33)。另外，对基于各通道中的每一个的相关成分的声源的位置进行估计，并且可基于声源的估计位置控制声场效果或者可基于声源的估计位置执行声源的声像定位。

应该注意，上面已经描述的第一优选实施例、第二优选实施例或第三优选实施例的说明在所有方面都是示出性的，并且不应理解为限制本发明。不是通过以上优选实施例而是通过权利要求来示出本发明的范围。此外，本发明的范围旨在包括权利要求的范围内以及等同物的含义和范围内的所有修改。

Claims

1.一种音频信号处理设备，包括：

输入单元，其配置为接收多个通道的音频信号的输入；

获得单元，其配置为获得声源的位置信息；

声场效果声产生单元，其配置为通过以预定增益对所述多个通道的音频信号进行组合，通过将滤波器系数与组合后的音频信号卷积而产生伪反射声，并且通过将产生的伪反射声单独地赋予所述多个通道中的每一个的音频信号而产生声场效果声；以及

控制单元，其配置为基于所述位置信息控制将在声场效果声产生单元中赋予的声场效果。

2.根据权利要求1所述的音频信号处理设备，其中：

所述控制单元基于所述位置信息控制所述声场效果声产生单元中的各通道中的每一个的增益。

3.根据权利要求1或权利要求2所述的音频信号处理设备，其中：

所述声场效果声产生单元包括第一声场效果声产生单元和第二声场效果声产生单元；

所述第一声场效果声产生单元基于预定参数通过将声场效果单独地赋予各通道中的每一个的音频信号来执行产生声场效果声的处理；并且

所述第二声场效果声产生单元基于所述控制单元的控制执行将声场效果单独地赋予各通道中的每一个的音频信号的处理。

4.根据权利要求1或2所述的音频信号处理设备，其中：

所述获得单元获得每个波段的声源的位置信息；并且

所述控制单元基于每个波段的声源的位置信息设置所述声场效果声产生单元中的参数。

5.根据权利要求1或2所述的音频信号处理设备，还包括：相关检测单元，其配置为检测各通道之间的相关成分，其中所述获得单元基于所述相关检测单元检测的相关成分来获得声源的位置信息。

6.根据权利要求5所述的音频信号处理设备，还包括：波段划分单元，其配置为针对每个预定波段划分所述多个通道的音频信号中的每一个，其中所述相关检测单元针对每个波段检测相关成分。

7.根据权利要求5所述的音频信号处理设备，还包括：等级检测单元，其配置为检测每个划分波段的等级，其中所述获得单元基于每个划分波段的等级获得关于声音的类型的信息。

8.根据权利要求1或2所述的音频信号处理设备，其中，所述获得单元从对应于音频信号的内容数据中获得声源的位置信息。

9.根据权利要求1或2所述的音频信号处理设备，还包括：

声像定位处理单元，其配置为基于所述位置信息执行声源的声像定位；以及

接收单元，其配置为接收改变收听环境的改变命令，其中

所述控制单元根据已被所述接收单元接收的改变命令来控制所述声像定位处理单元的声像位置。

10.根据权利要求9所述的音频信号处理设备，还包括存储单元，其配置为存储针对每个收听位置的声场效果信息，所述声场效果信息用于将声场效果赋予音频信号，其中：

所述接收单元接收对收听位置的设置作为改变收听环境的改变命令；并且

所述控制单元根据被所述接收单元接收的对收听位置的设置从所述存储单元中读取声场效果信息，并且对所述声场效果声产生单元设置声场效果信息。

11.根据权利要求10所述的音频信号处理设备，其中，所述控制单元读出存储在所述存储单元中的多条声场效果信息，并且对与已读出的所述多条声场效果信息中的每一条相对应的收听位置的声场效果信息进行插值。

12.根据权利要求9所述的音频信号处理设备，还包括方向检测单元，其配置为检测收听者面对的方向，其中，所述控制单元根据已在所述方向检测单元中检测到的收听者面对的方向来控制所述声像定位处理单元的声像位置。

13.根据权利要求1或2所述的音频信号处理设备，其中：

所述获得单元还获得指示声源的类型的信息；并且

所述控制单元基于指示声源的类型的信息针对各类型的声源设置不同的增益。

14.一种处理音频信号的方法，所述方法包括：

对多个通道的音频信号的输入进行接收的输入步骤；

获得声源的位置信息的获得步骤；

通过以预定增益对所述多个通道的音频信号进行组合,通过将滤波器系数与组合后的音频信号卷积而产生伪反射声，并且通过将产生的伪反射声单独地赋予各通道中的每一个的音频信号来产生声场效果声的声场效果声产生步骤；以及

基于位置信息对将在所述声场效果声产生步骤中赋予的声场效果进行控制的控制步骤。

15.根据权利要求14所述的处理音频信号的方法，还包括检测各通道之间的相关成分的相关检测步骤，其中，在所述获得步骤中，基于在所述相关检测步骤中检测的相关成分来获得声源的位置信息。

16.根据权利要求14所述的处理音频信号的方法，还包括：

基于位置信息执行声源的声像定位的声像定位处理步骤；以及

接收改变收听环境的改变命令的接收步骤，其中

在所述控制步骤中，根据已在所述接收步骤中接收的改变命令来控制所述声像定位处理步骤中的声像位置。