CN110868668B

CN110868668B - 音响***

Info

Publication number: CN110868668B
Application number: CN201910751930.3A
Authority: CN
Inventors: 大沼充史
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2018-08-28
Filing date: 2019-08-15
Publication date: 2021-05-11
Anticipated expiration: 2039-08-15
Also published as: JP7025303B2; US10750280B2; CN110868668A; JP2020036112A; US20200077186A1

Abstract

提供一种能够在多个音响装置获取到相同的语音的情况下适当地处理该语音的音响***。音响***(1)具备经由网络连接的音响装置(100、200)，音响装置(100)包括：获取语音的语音获取部(102)；对所述语音进行音源定位的音源定位部(103)；音源信息交换部(104)，其从音响装置(200)获取与在音响装置(200)中获取到的所述语音相关的语音信息；音源判断部(105)，其在所述音源信息中存在与由音源定位部(103)确定的音源相同的音源的情况下，判断该音源信息中的音源的第二声压级是否大于由音源定位部(103)确定的音源的第一声压级；过滤处理部(106)，其在第二声压级大于第一声压级的情况下，对由音源定位部(103)确定的音源的语音进行过滤处理。

Description

音响***

技术领域

本发明涉及包含多个音响装置(麦克风阵列·扬声器***)的音响***。

背景技术

已知一种音响***，其确定说话者的音源的位置，并适当地获取从音源输出的语音。以往，提出了如下一种技术：获取从说话者发出的语音的多个麦克风配置在特定的方向上并基于由各麦克风获取到的语音，计算出说话者朝向各麦克风发出语音的方向与各麦克风配置的方向之间所呈的角度。

近年，提出了一种具备多个麦克风以及扬声器以实现语音会议***的麦克风阵列·扬声器***。在多个该麦克风阵列·扬声器***(音响装置)设置在开放空间等的情况下，可以想到对应于各个音响装置的集音区域重叠。例如，有时第一音响装置的集音区域的一部分与第二音响装置的集音区域的一部分重叠。在这种情况下，当位于重叠的集音区域的说话者朝向第一音响装置发话时，对第一音响装置来说成为适当的语音，但对第二音响装置来说则成为不必要的语音(噪声)。因此，需要掌握多个音响装置相互之间的位置关系，并确定重叠的集音区域。

本发明的目的在于提供一种能够在多个音响装置获取到相同的语音的情况下适当地处理该语音的音响***。

发明内容

本发明的一方面涉及的音响***是具备具备经由网络连接的多个音响装置的音响***，每个音响装置包括：语音获取部，其获取语音；音源定位部，其进行由所述语音获取部获取到的所述语音的音源定位；音源信息获取部，其从其他音响装置获取与在所述其他音响装置中获取到的所述语音相关的音源信息；音源判断部，其在由所述音源信息获取部获取到的所述音源信息中存在与由所述音源定位部确定的音源相同的音源的情况下，判断所述音源信息中的音源的声压级是否大于由所述音源定位部确定的音源的声压级；及过滤处理部，其在所述音源信息中的音源的声压级大于由所述音源定位部确定的音源的声压级的情况下，对由所述音源定位部确定的音源的所述语音进行过滤处理。

发明效果

根据本发明，能够在多个音响装置获取到相同的语音的情况下适当地处理该语音。

本说明书适当地参照附图，通过使对以下详细说明中记载的概念进行总结的内容简略化的方式来进行介绍。本说明书的意图并不是限定权利要求中记载的主题的重要特征和本质特征，此外，意图也不是限定权利要求中记载的主题的范围。此外，在权利要求中记载的对象，并不限定于解决本发明中任意部分中记载的一部分或全部缺点的实施方式。

附图说明

图1是示意性示出应用了本发明的实施方式涉及的音响***的会议***的图。

图2是示出本发明的第一实施方式涉及的音响***的构成的功能框图。

图3是示意性示出本发明的第一实施方式涉及的音响***中的各音响装置的扬声器的位置关系的图。

图4是示意性示出本发明的第一实施方式涉及的音响***中的各音响装置的扬声器的位置关系的图。

图5是用于说明本发明的第一实施方式涉及的音响***中的位置检测处理的步骤的一个示例的流程图。

图6是用于说明本发明的第一实施方式涉及的音响***中的位置检测处理的步骤的一个示例的流程图。

图7是示出本发明的第二实施方式涉及的音响***的构成的功能框图。

图8是用于说明本发明的第二实施方式涉及的音响***中的语音过滤处理的步骤的一个示例的流程图。

图9是用于说明本发明的第二实施方式涉及的音响***中的语音过滤处理的步骤的另一示例的流程图。

具体实施方式

以下参照附图说明本发明的实施方式。另外，以下的实施方式只是使本发明具体化的一例，并不具有限定本发明的技术范围的性质。

本发明涉及的音响***例如应用于设置在办公室的开放空间中的会议***。图1示意性地示出所述会议***的一个示例。音响***1包含分别构成麦克风阵列·扬声器***的音响装置100以及音响装置200。音响***1中只要包括2个以上的音响装置即可。此处，作为一个示例示出两个音响装置100、200。在音响***1中，通过波束形成技术等，在音响装置100设定集音区域10，在音响装置200设定集音区域20。音响装置100、200获取在各自设定的集音区域10、20中发出的语音。在图1所示的示例中，会议1的参加者A、B利用音响装置100进行会议，会议2的参加者C、D、E利用音响装置200进行会议。每个会议可以是仅所述参加者的会议，也可以是包括外部的参加者的视频会议。

音响装置100包括操作显示部13、至少两个麦克风14和至少一个扬声器15。在图1中，作为一个示例，示出了两个麦克风14a、14b和两个扬声器15a、15b。麦克风14a、14b以规定的间隔配置在操作显示部13的上部，扬声器15a、15b以规定的间隔配置在操作显示部13的下部。麦克风14a、14b收集会议1的参加者A、B所发出的语音。扬声器15a、15b输出参加会议1的视频会议的外部的参加者所发出的语音，或者输出由音响装置100存储或获取的语音数据的语音。操作显示部13显示有会议1的资料、会议1的参加者的影像、音响装置100存储或获取的图像等。麦克风14a、14b是本发明的第一麦克风的一个示例。扬声器15a、15b是本发明的第一扬声器的一个示例。操作显示部13是本发明的第一显示部的一个示例。

同样地，音响装置200包括操作显示部23、至少两个麦克风24和至少一个扬声器25。在图1中，作为一个示例，示出了两个麦克风24a、24b和两个扬声器25a、25b。麦克风24a、24b以规定的间隔配置在操作显示部23的上部，扬声器25a、25b以规定的间隔配置在操作显示部23的下部。麦克风24a、24b收集会议2的参加者C、D、E所发出的语音。扬声器25a、25b输出参加会议2的视频会议的外部的参加者所发出的语音，或者输出由音响装置200存储或获取的语音数据的语音。操作显示部23显示有会议2的资料、会议2的参加者的影像、音响装置200存储或获取的图像等。麦克风24a、24b是本发明的第二麦克风的一个示例。扬声器25a、25b是本发明的第二扬声器的一个示例。操作显示部23是本发明的第二显示部的一个示例。

此处，在图1所示的示例中，音响装置100的集音区域10的一部分与音响装置200的集音区域20的一部分重叠。另外，在重叠的区域(重叠区域S1)存在会议2的参加者C。在这种情况下，在参加者C朝向音响装置200发话了的情况下，麦克风24a、24b收集参加者C的语音，音响装置200获取该语音。另一方面，麦克风14a、14b也收集参加者C的语音，音响装置100获取该语音。音响装置200获取的语音是与会议2相关的适当的语音，但音响装置100获取的语音成为与会议1无关的不适当的语音(噪声)。

这样，在构成多个集音区域，且集音区域重叠的音响***中，可能产生哪个音响装置收集成为噪声的语音的问题。作为解决该问题的方法，可以想到掌握多个音响装置相互之间的位置关系，并去除成为噪声的语音等。在下文中，在第一实施方式中，对掌握多个音响装置相互之间的位置关系的构成进行说明，在第二实施方式中，对去除成为噪声的语音(过滤处理)的构成进行说明。

[第一实施方式]

图2是表示本发明的第一实施方式涉及的音响***1的概要构成的图。音响装置100、200均连接到网络N1并能够与外部设备通信。网络N1是因特网、LAN、WAN或公共电话线等的通信网络。例如，音响装置100、200均使用网络N1构建视频会议***。

[音响装置100]

如图2所示，音响装置100包括控制部11、存储部12、操作显示部13、麦克风14、扬声器15、通信接口16等。音响装置100例如也可以是如显示装置、个人计算机这样的信息处理装置。音响装置100是本发明的第一音响装置的一个示例。

通信接口是用于通过有线或无线将音响装置100连接到网络N1，并且经由网络N1在与其他的外部设备(例如音响装置200)之间执行按照规定的通信协议的数据通信的通信接口。

扬声器15包含以规定间隔配置在操作显示部13的下部的两个扬声器15a、15b(参照图1)，且扬声器15a、15b的每一个将语音向外部输出。扬声器15a、15b从音响装置100的中心开始左右均匀地配置。

麦克风14包含以规定间隔配置在操作显示部13的上部的两个麦克风14a、14b(参照图1)，且麦克风14a、14b的每一个收集语音。麦克风14a、14b从音响装置100的中心开始左右均匀地配置。

操作显示部13是包括如显示各种信息的液晶显示器或有机EL显示器这样的显示部和受理操作的鼠标、键盘或触摸面板等操作部的用户界面。

存储部12是包含存储各种信息的半导体存储器、HDD(Hard Disk Drive，硬盘驱动器)或SSD(Solid State Drive，固态驱动器)等的非易失性的存储部。例如，存储部12存储有用于使控制部11执行后述的位置检测处理(参照图5及图6)的位置检测处理程序等的控制程序。例如，所述位置检测处理程序非易失性地存储在USB、CD或DVD(所有注册商标)等的计算机可读取的记录介质中,且由电连接到音响装置100的USB驱动器、CD驱动器或DVD驱动器等的读取装置(未图示)读取并存储到存储部12中。所述位置检测处理程序也可以经由网络N1从外部设备下载并存储到存储部12中。

另外，存储部12存储有音响装置100的设备信息121。设备信息121包含有表示识别音响装置100的固有信息的UUID(Universally Unique Identifier，通用唯一标识符)信息、表示构成音响装置100的设备的信息的构成信息等。构成信息包含有音响装置100内的麦克风14a、14b以及扬声器15a、15b的配置信息，例如距离以及角度等的信息。存储部12是本发明的第一存储部的一个示例。

控制部11具有CPU、ROM以及RAM等的控制设备。所述CPU是执行各种运算处理的处理器。所述ROM是预先存储了用于使所述CPU执行各种运算处理的BIOS和OS等的控制程序的非易失性的存储部。所述RAM是存储各种信息的易失性或非易失性的存储部，且作为所述CPU执行的各种处理的临时存储存储器(作业区域)使用。并且，控制部11通过由所述CPU执行预先存储在所述ROM或存储部12中的各种控制程序来控制音响装置100。

具体而言，控制部11包含设备检测部111、构成信息交换部112、测试语音收发部113、扬声器音源定位部114、位置计算部115、位置通知部116等的各种处理部。此外，控制部11通过所述CPU执行根据所述位置检测处理程序的各种处理而作为所述各种处理部发挥功能。另外，控制部11所包含的一部分或者全部的处理部也可以由电子电路构成。另外，所述位置检测处理程序也可以是用于使多个处理器作为所述各种处理部发挥功能的程序。

设备检测部111检测连接到网络N1的其他的音响装置(此处为音响装置200)。设备检测部111是本发明的第一设备检测部的一个示例。例如，设备检测部111利用UPNP(Universal Plug and Play，通用即插即用)功能自动识别音响装置200。此外，设备检测部111也可以通过将UUID信息嵌入可听区域外的语音数据并定期地输出来识别音响装置200。设备检测部111检测其他音响装置的方法可以采用公知的方法。

构成信息交换部112与由设备检测部111检测出的其他音响装置200进行构成信息的交换。例如，构成信息交换部112将音响装置100内的麦克风14a、14b以及扬声器15a、15b的距离以及角度(第一构成信息)发送到音响装置200，并从音响装置200接收音响装置200内的麦克风24a、24b以及扬声器25a、25b的距离以及角度(第二构成信息)。

测试语音收发部113获取从由设备检测部111检测出的其他音响装置200的扬声器25a、25b输出的测试语音。测试语音收发部113是本发明的第一语音获取部的一个示例。另外，测试语音收发部113使测试语音从音响装置100的扬声器15a、15b输出。所述测试语音是用于确定音响装置100、200的相互的位置关系的语音，例如能够使用包含UUID信息的可听区域外的语音。此处，在音响装置100设为主设备且音响装置200设为从属设备的情况下，测试语音收发部113向音响装置200发送指示(语音输出指示)，以使从扬声器25a、25b输出测试语音。

扬声器音源定位部114基于由测试语音收发部113获取到的测试语音，对文本语音的音源即音响装置200的扬声器25a、25b进行音源定位。例如，扬声器音源定位部114基于收集从扬声器25a输出的测试语音的两个麦克风14a、14b的构成信息(距离及角度)和扬声器25a的构成信息(距离及角度)，进行扬声器25a的音源定位。另外，扬声器音源定位部114基于收集从扬声器25b输出的测试语音的两个麦克风14a、14b的构成信息(距离及角度)和扬声器25b的构成信息(距离及角度)，进行扬声器25b的音源定位。扬声器音源定位部114是本发明的第一音源定位部的一个示例。

位置计算部115基于由构成信息交换部112获取到的扬声器25a、25b的距离及角度，和根据扬声器音源定位部114的音源定位的结果，计算扬声器25a、25b相对于音响装置100的位置(距离及角度)。位置计算部115是本发明的第一位置计算部的一个示例。

图3示意性地示出了音响装置100与音响装置200的扬声器25a、25b之间的位置关系。扬声器15a、15b之间的距离L1和扬声器15a、15b相对于音响装置100的中心C1的位置的信息包含在音响装置100的构成信息的配置信息。另外，扬声器25a、25b之间的距离L2和扬声器25a、25b相对于音响装置200的中心C2的位置的信息包含在音响装置200的构成信息的配置信息。

如图3所示，位置计算部115基于扬声器25a、25b的配置信息与音源定位的结果，计算扬声器25a相对于音响装置100的中心C1的距离L2a及角度θ2a和扬声器25b相对于音响装置100的中心C1的距离L2b及角度θ2b。另外，位置计算部115基于音响装置200的构成信息和与音源定位的结果，计算音响装置200相对于音响装置100的中心C1的距离L2c及角度θ2c。

位置通知部116向音响装置200通知由位置计算部115计算出的距离及角度的信息(第一位置信息)，即扬声器25a相对于音响装置100的距离L2a及角度θ2a和扬声器25b相对于音响装置100的距离L2b及角度θ2b的信息。另外，位置通知部116接收从后述的音响装置200通知的距离及角度的信息(第二位置信息)。位置通知部116是本发明的第一位置通知部的一个示例。

[音响装置200]

如图2所示，音响装置200具有与音响装置100相同的构成及功能。在下文中，适当地省略对具有与音响装置100相同的功能的构成的说明。音响装置200是本发明的第二音响装置的一个示例。

存储部22是包含存储各种信息的半导体存储器、HDD(Hard Disk Drive，硬盘驱动器)或SSD(Solid State Drive，固态驱动器)等的非易失性的存储部。例如，存储部22存储有用于使控制部21执行后述的位置检测处理(参照图5及图6)的位置检测处理程序等的控制程序。例如，所述位置检测处理程序非易失性地存储在USB、CD或DVD(所有注册商标)等的计算机可读取的记录介质中,且由电连接到音响装置200的USB驱动器、CD驱动器或DVD驱动器等的读取装置(未图示)读取并存储到存储部22中。所述位置检测处理程序也可以经由网络N1从外部设备下载并存储到存储部22中。

另外，存储部22存储有音响装置200的设备信息221。设备信息221包含有表示识别音响装置200的固有信息的UUID、表示构成音响装置200的设备的信息的构成信息等。构成信息包含有音响装置200内的麦克风24a、24b以及扬声器25a、25b的配置信息，例如距离以及角度等的信息。存储部22是本发明的第二存储部的一个示例。

控制部21包含设备检测部211、构成信息交换部212、测试语音收发部213、扬声器音源定位部214、位置计算部215、位置通知部216等的各种处理部。此外，控制部21通过所述CPU执行根据所述位置检测处理程序的各种处理而作为所述各种处理部发挥功能。另外，控制部21所包含的一部分或者全部的处理部也可以由电子电路构成。另外，所述位置检测处理程序也可以是用于使多个处理器作为所述各种处理部发挥功能的程序。

设备检测部211检测连接到网络N1的其他的音响装置(此处为音响装置100)。设备检测部211是本发明的第二设备检测部的一个示例。

构成信息交换部212与由设备检测部211检测出的其他音响装置100进行构成信息的交换。例如，构成信息交换部212将音响装置200内的麦克风24a、24b以及扬声器25a、25b的距离以及角度(第二构成信息)发送到音响装置100，并从音响装置100接收音响装置100内的麦克风14a、14b以及扬声器15a、15b的距离以及角度(第一构成信息)。

测试语音收发部213获取从由设备检测部211检测出的其他音响装置100的扬声器15a、15b输出的测试语音。另外，测试语音收发部213使测试语音从扬声器25a、25b输出。在音响装置100设为主设备且音响装置200设为从属设备的情况下，测试语音收发部213若从音响装置100接收到所述语音输出指示，则使测试语音从扬声器25a、25b输出。测试语音包含有音响装置200的UUID信息。测试语音收发部213是本发明的语音输出部及第二语音获取部的一个示例。

扬声器音源定位部214基于由测试语音收发部213获取到的测试语音，对文本语音的音源即音响装置100的扬声器15a、15b进行音源定位。例如，扬声器音源定位部214基于收集从扬声器15a输出的测试语音的两个麦克风24a、24b的构成信息(距离及角度)和扬声器15a的构成信息(距离及角度)，进行扬声器15a的音源定位。另外，扬声器音源定位部214基于收集从扬声器15b输出的测试语音的两个麦克风24a、24b的构成信息(距离及角度)和扬声器15b的构成信息(距离及角度)，进行扬声器15b的音源定位。扬声器音源定位部214是本发明的第二音源定位部的一个示例。

位置计算部215基于由构成信息交换部212获取到的扬声器15a、15b的距离及角度，和根据扬声器音源定位部214的音源定位的结果，计算扬声器15a、15b相对于音响装置200的位置(距离及角度)。位置计算部215是本发明的第二位置计算部的一个示例。

图4示意性地示出了音响装置100的扬声器15a、15b与音响装置200之间的位置关系。如图4所示，音响装置200的位置计算部215基于扬声器15a、15b的配置信息与音源定位的结果，计算扬声器15a相对于音响装置200的中心C2的距离L1a及角度θ1a和扬声器15b相对于音响装置200的中心C2的距离L1b及角度θ1b。另外，位置计算部215基于音响装置100的构成信息和与音源定位的结果，计算音响装置100相对于音响装置200的中心C2的距离L1c及角度θ1c。

位置通知部216向音响装置100通知由位置计算部215计算出的距离及角度的信息(第二位置信息)，即扬声器15a相对于音响装置200的距离L1a及角度θ1a和扬声器15b相对于音响装置200的距离L1b及角度θ1b的信息。另外，位置通知部216接收从音响装置100通知的所述第一位置信息。位置通知部216是本发明的位置接收部及第二位置通知部的一个示例。

音响装置100、200可以通过交换分别计算出的所述位置信息来掌握音响装置100、200的相互的位置关系。

[位置检测处理]

以下，参照图5说明由音响装置100的控制部11执行的位置检测处理的步骤的一个示例。

步骤S101中，控制部11(设备检测部111)检测连接到网络N1的其他的音响装置(此处为音响装置200)。在检测出音响装置200的情况下(S101：是)，处理转移到步骤S102。

步骤S102中，在音响装置100成为主设备的情况下(S102：是)，处理转移到步骤S103。在音响装置100成为从属设备的情况下(S102：否)，音响装置100执行后述的处理(参照图6)。音响装置成为主设备或从属设备的方法可以采用公知的方法。此处，设音响装置100为主设备、音响装置200为从属设备。

步骤S103中，控制部11(构成信息交换部112)与音响装置200进行构成信息的交换。具体而言，控制部11将音响装置100内的麦克风14a、14b以及扬声器15a、15b的配置信息(距离及角度)发送到音响装置200，并从音响装置200接收音响装置200内的麦克风24a、24b以及扬声器25a、25b的配置信息(距离及角度)。

步骤S104中，控制部11(测试语音收发部113)对从属设备的音响装置200进行指示(语音输出指示)，以使从扬声器25a、25b输出测试语音。在控制部11(测试语音收发部113)经由麦克风14a、14b获取到从扬声器25a、25b输出的所述测试语音的情况下(S105：是)，处理转移到步骤S106。在控制部11未能获取到所述测试语音的情况下(S105：否)，处理转移到步骤S110。

步骤S106中，在控制部11(扬声器音源定位部114)基于所述测试语音完成了任一个扬声器(例如扬声器25a)的音源定位的情况下(S106：是)，处理转移到步骤S107。在控制部11基于所述测试语音未能完成扬声器25a的音源定位的情况下(S106：否)，处理转移到步骤S110。

步骤S107中，在存在音源定位未完成的其他扬声器的情况下(S107：是)，处理返回到步骤S105，在不存在音源定位未完成的其他扬声器的情况下(S107：否)，处理转移到步骤S108。此处，由于存在另一个扬声器25b，因此处理返回到步骤S105并重复上述的处理。若完成对扬声器25a、25b的音源定位，则处理转移到步骤S108。

步骤S108中，控制部11(位置计算部115)基于扬声器25a、25b的配置信息(距离及角度)，和根据扬声器音源定位部114的音源定位的结果，计算扬声器25a、25b相对于音响装置100的位置(距离及角度)。

步骤S109中，控制部11(位置通知部116)向音响装置200通知扬声器25a相对于音响装置100的距离L2a及角度θ2a和扬声器25b相对于音响装置100的距离L2b及角度θ2b的信息(位置信息)。

步骤S110中，控制部11对音响装置200设定表示已执行了该位置检测处理的信息(标志等)。之后，处理返回到步骤S101，执行其他音响装置的检测处理。

以下，一边参照图6一边说明由成为从属设备的音响装置200的控制部21执行的位置检测处理的步骤的一个示例。

步骤S201中，控制部21(设备检测部211)检测连接到网络N1的其他的音响装置(此处为音响装置100)。在检测出音响装置100的情况下(S201：是)，处理转移到S202。

步骤S202中，在音响装置200未成为主设备的情况(S202：否)，即成为了从属设备的情况下，处理转移到步骤S203。在音响装置200成为了主属设备的情况下(S202：是)，音响装置200执行上述的处理(参照图5)。此处，由于音响装置100为主设备、音响装置200为从属设备，因此处理转移到步骤S203。

步骤S203中，控制部21(构成信息交换部212)与音响装置100进行构成信息的交换。具体而言，控制部21将音响装置200内的麦克风24a、24b以及扬声器25a、25b的配置信息(距离及角度)发送到音响装置100，并从音响装置100接收音响装置100内的麦克风14a、14b以及扬声器15a、15b的配置信息(距离及角度)。

步骤S204中，在控制部21(测试语音收发部213)从音响装置100接收到所述语音输出指示的情况下(S204：是)，处理转移到步骤S205。

步骤S205中，控制部21(测试语音收发部213)使测试语音从扬声器25a、25b输出。

步骤S206中，在音响装置100中扬声器25a、25b的音源定位完成了的情况下(S206：是)，处理转移到步骤S207。在所述音源定位未完成的情况下(S206：否)，处理返回到步骤S204。

步骤S207中，控制部21(位置通知部216)接收从音响装置100发送的所述位置信息，即扬声器25a相对于音响装置100的距离L2a及角度θ2a和扬声器25b相对于音响装置100的距离L2b及角度θ2b的信息。

音响装置100、200在分别执行了上述的位置检测处理(参照图5及图6)之后，音响装置100执行由图6的虚线框围绕的“处理2”，并且音响装置200执行由图6的虚线框围绕的“处理1”。由此，音响装置100、200分别掌握另一音响装置的音源(扬声器)相对于自身的位置(距离及角度)。因此，能够掌握音响装置100、200相互之间的位置关系。

[第二实施方式]

图7是表示本发明的第二实施方式涉及的音响***1的概要构成的图。对于与第一实施方式涉及的音响***1相同的构成，省略说明。音响装置100、200具有相同的构成及功能。在下文中，以音响装置100为例进行说明。

音响装置100的存储部12是包含存储各种信息的半导体存储器、HDD(Hard DiskDrive，硬盘驱动器)或SSD(Solid State Drive，固态驱动器)等的非易失性的存储部。例如，存储部12存储有用于使控制部11执行后述的音源过滤处理(参照图8)的音源过滤处理程序等的控制程序。例如，所述音源过滤处理程序非易失性地存储在USB、CD或DVD(所有注册商标)等的计算机可读取的记录介质中,且由电连接到音响装置100的USB驱动器、CD驱动器或DVD驱动器等的读取装置(未图示)读取并存储到存储部12中。所述音源过滤处理程序也可以经由网络N1从外部设备下载并存储到存储部12中。

如图7所示，音响装置100的控制部11在图2所示的各处理部的基础上，还包括时间戳处理部101、语音获取部102、音源定位部103、音源信息交换部104、音源判断部105、过滤处理部106等的各种处理部。此外，控制部11通过所述CPU执行根据所述音源过滤处理程序的各种处理而作为所述各种处理部发挥功能。另外，控制部11所包含的一部分或者全部的处理部也可以由电子电路构成。另外，所述音源过滤处理程序也可以是用于使多个处理器作为所述各种处理部发挥功能的程序。

时间戳处理部101进行时间戳的校正等以获得与其他音响装置(此处为音响装置200)的同步。

在通过所述位置检测处理(参照图5及图6)构建了音响***1之后，语音获取部102获取由麦克风14a、14b收集的说话者的语音。例如在图1所示的会议***中，语音获取部102获取位于集音区域10的会议1的参加者A、B所发出的语音。另外，语音获取部102获取位于重叠区域S1的会议2的参加者C所发出的语音。控制部11对由语音获取部102获取到的参加者A、B的语音进行规定的语音处理。例如，在视频会议***中，控制部11经由网络N1将参加者A、B的语音的语音数据发送到远程位置处的外部设备。语音获取部102是本发明的语音获取部的一个示例。

音源定位部103基于由语音获取部102获取到的语音，进行该语音的音源定位。另外，音源定位部103基于所述语音测量声压级、频谱等。音源定位部103是本发明的音源定位部的一个示例。

音源信息交换部104进行与其他音响装置(此处为音响装置200)的音源信息的交换。例如，音源信息交换部104向音响装置200发送由音源定位部103获得的、包含音源定位的结果、声压级、频谱等的音源信息，并从音响装置200接收由后述的音响装置200的音源定位部203获得的、包含音源定位的结果、声压级、频谱等的音源信息。音源信息交换部104是本发明的音源信息获取部的一个示例。

音源判断部105判断在从音响装置200获取到的所述音源信息中，是否存在与由音源定位部103确定的音源相同的音源。在所述音源信息中存在所述相同的音源的情况下，音源判断部105还判断从音响装置200获取到的所述音源信息中的音源的声压级(以下，称为第二声压级)是否大于由音源定位部103确定的音源的声压级(以下，称为第一声压级)。音源判断部105是本发明的音源判断部的一个示例。

在所述第二声压级大于所述第一声压级的情况下，过滤处理部106对所述相同的音源实施过滤处理。例如，过滤处理部106通过向麦克风14a、14b输入与从所述相同的音源获取的语音的相位相反的语音来消除从所述相同的音源获取的语音。语音的过滤处理可以采用公知的方法。另外，在所述第二声压级在所述第一声压级以下的情况下，过滤处理部106解除所述相同的音源的过滤处理。在解除了过滤处理的情况下，控制部11对由语音获取部102获取到的语音进行所述规定的语音处理。过滤处理部106是本发明的过滤处理部的一个示例。

音响装置200的控制部21中包含的各处理部执行与音响装置200的控制部11中包含的所述各处理部相同的处理。

[音源过滤处理]

以下，参照图8说明由音响装置100的控制部11执行的音源过滤处理的步骤的一个示例。另外，音响***1中包含的各音响装置执行相同的音源过滤处理。此处，举出图1所示的会议***的应用场景为例。

步骤S301中，控制部11(时间戳处理部101)进行时间戳的校正以获得与音响装置200的同步。

步骤S302中，在控制部11(语音获取部102)获取到说话者的语音的情况下(S302：是)，处理转移到步骤S303。另外，控制部11对获取到的语音的语音数据赋予时间戳。

步骤S303中，控制部11(音源定位部103)基于由语音获取部102获取到的语音，进行音源定位。

步骤S304中，控制部11(音源信息交换部104)与音响装置200进行音源信息的交换。

步骤S305中，控制部11(音源判断部105)判断在从音响装置200获取到的所述音源信息中，是否存在与由音源定位部103确定的音源相同的音源。另外，在所述判断处理中，控制部11也可以使用被赋予到语音数据中的时间戳的信息等。在所述音源信息中存在所述相同的音源的情况下(S305：是)，例如在重叠区域S1存在说话者(此处为参加者C)的情况下，处理转移到步骤S306。在所述音源信息中不存在所述相同的音源的情况下(S305：否)，即在重叠区域S1不存在说话者的情况下，处理转移到步骤S310。

步骤S306中，控制部11(音源判定部105)判断从音响装置200获取到的所述音源信息中的音源的声压级(第二声压级)是否大于由音源定位部103确定的音源的声压级(第一声压级)。在所述第二声压级大于所述第一声压级的情况下(S306：是)，处理转移到步骤S307。在所述第二声压级为所述第一声压级以下的情况下(S306：否)，处理转移到步骤S308。

步骤S307中，控制部11(过滤处理部106)对所述相同的音源实施所述过滤处理。之后，处理返回到步骤S302。

步骤S308中，控制部11判断是否对所述相同的音源设定了所述过滤处理。在未对所述相同的音源设定所述过滤处理的情况下(S308：否)，处理直接转移到步骤S310。另一方面，在对所述相同的音源设定了所述过滤处理的情况下(S308：是)，在步骤S309中，控制部11(过滤处理部106)解除对所述相同的音源设定的所述过滤处理。之后，处理转移到步骤S310。

步骤S310中，控制部11在从重叠区域S1之外的其他区域获取到语音的情况下(S305：否)，此处为获取到参加者A、B的语音的情况下，对该语音执行所述规定的语音处理。另外，控制部11在未对所述相同的音源设定所述过滤处理的情况下(S308：否)，或者在解除了对所述相同的音源设定的所述过滤处理的情况下(S309)，执行所述规定的语音处理。之后，处理返回到步骤S302。

各音响装置在每次获取说话者的语音时执行上述的处理。由此，各音响装置100、200可以适当地处理原始语音，并去除成为噪声的语音。这样，根据第二实施方式涉及的音响***1，可以在多个音响装置获取到相同的音源的语音的情况下对该语音进行适当地处理。

第二实施方式涉及的音响***1也可以是以下的构成。图9是表示由音响装置100的控制部11执行的音源过滤处理的另一示例的流程图。此外，图9所示的步骤S401～S405、S410的步骤与图8所示的步骤S301～S305、S310的步骤相同，因此省略说明。

例如，在图1所示的会议***中，在音响装置100的扬声器15a、15b的位置与参加者C的位置接近的情况下，在音响装置200中，可以想到将从扬声器15a、15b输出的语音(例如远程位置处的说话者的语音)与参加者C发出的语音判断为相同位置的音源的情况。在这种情况下，音响装置200获取参加者C发出的语音的同时获取从扬声器15a、15b输出的语音，但对音响装置200而言从扬声器15a、15b输出的语音成为了噪声。

因此，例如，如图9所示，步骤S406中，音响装置100的控制部11判断对于所述相同位置的音源，从自身的扬声器15a、15b输出的语音的声压级与从音响装置200获取到的所述音源信息中的音源的声压级之间的差(声压级差)是否大于阈值。在所述声压级差大于阈值的情况下(S406：是)，处理转移到步骤S407，在所述声压级差为阈值以下的情况下(S406：否)，处理转移到步骤S410。

步骤S407中，控制部11降低扬声器15a、15b的输出声压级。例如，控制部11使扬声器15a、15b的输出声压级降低所述声压级差的量。由此，音响装置200可以去除从音响装置100的扬声器15a、15b输出的成为噪声的语音。

在上述的说明中，举出将音响***1应用于会议***的情况作为示例，但本发明的音响***并不限定于此。例如，本发明的音响***也可以应用于智能扬声器、AI扬声器等。在这种情况下，音响***1配置有多个智能扬声器(音响装置)。由智能扬声器获取的育婴例如用作通过语音执行各种处理的语音指令。根据该构成，可以通过各智能扬声器适当地获取朝向其自身发出的原始语音并对不必要的语音(噪声)进行过滤处理来防止误动作。

本发明的范围并不限于上述内容，而是由权利要求的记载来定义，所以可以认为本说明书记载的实施方式只是举例说明，而并非进行限定。因此，所有不脱离权利要求的范围、界限的更改，以及等同于权利要求的范围、界限的内容都包含在权利要求的范围内。

Claims

1.一种音响***，其具备经由网络连接的多个音响装置，所述音响***的特征在于，

每个音响装置包括：

语音获取部，其获取语音；

音源定位部，其进行由所述语音获取部获取到的所述语音的音源定位；

音源信息获取部，其从其他音响装置获取与在所述其他音响装置中获取到的所述语音相关的音源信息；

音源判断部，其在由所述音源信息获取部获取到的所述音源信息中存在与由所述音源定位部确定的音源相同的音源的情况下，判断所述音源信息中的音源的声压级是否大于由所述音源定位部确定的音源的声压级；及

过滤处理部，其在所述音源信息中的音源的声压级大于由所述音源定位部确定的音源的声压级的情况下，对由所述音源定位部确定的音源的所述语音进行过滤处理。

2.根据权利要求1所述的音响***，其特征在于，

输入到设置于所述音响装置的麦克风的语音与从与由所述音源定位部确定的音源相同的音源获取的语音不同，是与从所述相同的音源获取的语音相位相反的语音。

3.根据权利要求1或权利要求2所述的音响***，其特征在于，

由所述音源信息获取部获取到的所述音源信息包含所述其他音响装置中获取到的所述语音的音源定位的结果以及所述语音的声压级。

4.根据权利要求1或权利要求2所述的音响***，其特征在于，

在所述音源信息中的音源的声压级为由所述音源定位部确定的音源的声压级以下的情况下，所述每个音响装置对由所述音源定位部确定的音源的所述语音执行规定的语音处理。

5.根据权利要求1或权利要求2所述的音响***，其特征在于，

所述每个音响装置具备存储部，其存储识别所述音响装置的固有信息和构成所述音响装置的设备的信息。

6.根据权利要求1或权利要求2所述的音响***，其特征在于，

所述每个音响装置具备至少一个扬声器和至少两个麦克风。

7.根据权利要求1或权利要求2所述的音响***，其特征在于，

所述每个音响装置具备显示信息的显示部。