CN112612444A

CN112612444A - 声源位置定位方法、装置、电子设备和存储介质

Info

Publication number: CN112612444A
Application number: CN202011584012.5A
Authority: CN
Inventors: 张斌; 蒋兆
Original assignee: Nanjing Ziniu Software Technology Co ltd
Current assignee: Jiangsu Zimi Electronic Technology Co Ltd
Priority date: 2020-12-28
Filing date: 2020-12-28
Publication date: 2021-04-06

Abstract

本发明实施例公开了一种声源位置定位方法、装置、电子设备和存储介质。其中，所述方法包括：获取目标对象的头部的第一初始位置，以及与所述第一初始位置对应的目标声音信息的声源的第二初始位置；基于目标对象的头部在转动过程中的转动参数信息，确定所述目标对象的头部的当前位置相对于所述第一初始位置的角度参数信息；基于所述角度参数信息，将声源的位置调整至所述第二初始位置处。以实现将耳机播放的语音数据固定在一个位置，让用户在感知上认为是在和一个真实位置的人物进行对话，提高语音交互的真实感，提高用户体验。

Description

声源位置定位方法、装置、电子设备和存储介质

技术领域

本发明实施例涉及定位技术，尤其涉及一种声源位置定位方法、装置、电子设备和存储介质。

背景技术

近年来，在全球智能手机、平板电脑等新一代消费电子设备快速普及的背景下，耳机类产品特别是无线耳机产品呈现出了爆发性增长的趋势。手机语音助手越发智能，通过手机语音助手，我们可以播放音乐，查询天气，拨打电话，控制家里的智能设备，这些都只需要一句话，即可唤醒语音助手。

语音助手语音交互数据通过蓝牙通信发送到蓝牙耳机的喇叭进行播放，播放的声音不具备方位感，即用户头部转动时，播放的声音随着头部一起转动，让用户在感知上认为不是在和一个真实位置的人物进行对话，语音交互不具有真实感，用户体验差。

发明内容

本发明实施例提供一种声源位置定位方法、装置、电子设备和存储介质，以实现将耳机播放的语音数据固定在一个位置，让用户在感知上认为是在和一个真实位置的人物进行对话，提高语音交互的真实感，提高用户体验。

第一方面，本发明实施例提供了一种声源位置定位方法，该方法包括：

获取目标对象的头部的第一初始位置，以及与所述第一初始位置对应的目标声音信息的声源的第二初始位置；

基于目标对象的头部在转动过程中的转动参数信息，确定所述目标对象的头部的当前位置相对于所述第一初始位置的角度参数信息；

基于所述角度参数信息，将声源的位置调整至所述第二初始位置处。

第二方面，本发明实施例还提供了一种声源位置定位装置，该装置包括：

初始位置获取模块，用于获取目标对象的头部的第一初始位置，以及与所述第一初始位置对应的目标声音信息的声源的第二初始位置；

角度参数信息确定模块，用于基于目标对象的头部在转动过程中的转动参数信息，确定所述目标对象的头部的当前位置相对于所述第一初始位置的角度参数信息；

声源位置定位模块，用于基于所述角度参数信息，将声源的位置调整至所述第二初始位置处。

第三方面，本发明实施例还提供了一种电子设备，该电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明实施例中任一所述的声源位置定位方法。

第四方面，本发明实施例还提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行本发明实施例中任一所述的声源位置定位方法。

本发明实施例的技术方案，通过获取目标对象的头部的第一初始位置，以及与第一初始位置对应的目标声音信息的声源的第二初始位置，在目标对象的头部转动时，获取目标对象的头部在转动过程中的转动参数信息，通过实时计算目标对象的头部运动过程中的转动参数信息，确定目标对象的头部的当前位置相对于第一初始位置的角度参数信息，基于角度参数信息，可将声源的位置调整至第二初始位置处，这样在目标对象的头部转动时，可使声源的位置保持固定，用户和声音播放模块交流时，让用户在感知上认为是和一个真实位置的人物进行对话，具有交互真实感，提升了用户体验。

附图说明

图1是本发明实施例一中的声源位置定位方法的流程图；

图2是本发明实施例二中的声源位置定位方法的流程图；

图3是本发明实施例三中的声源位置定位方法的执行流程图；

图4是本发明实施例四中的声源位置定位装置的结构示意图；

图5是本发明实施例五中的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的声源位置定位方法的流程图，本实施例可适用于对声源位置进行定位的情况，具体的是适用于将声源位置固定在某一位置处的情况，该方法可以由声源位置定位装置来执行，该声源位置定位装置可以由软件和/或硬件来实现，该声源位置定位装置可以配置在电子计算设备上，具体包括如下步骤：

S110、获取目标对象的头部的第一初始位置，以及与第一初始位置对应的目标声音信息的声源的第二初始位置。

示例性的，目标对象可以是人。

第一初始位置可以是目标对象的头部的初始位置。这里的初始位置可以是目标对象的头部在进行转动之前的位置。

在本发明实施例中，可以是在目标对象的头部配置有耳机，具体的可以是如本领域技术人员所公知的，在目标对象的耳朵上可佩戴有耳机，在耳机中设置有陀螺仪，可以根据陀螺仪来获取目标对象的头部的第一初始位置。具体的可以是利用陀螺仪来记录耳机的初始位置，由于耳机设置在目标对象的耳朵上，因此，这里的陀螺仪所记录的耳机的初始位置即为目标对象的头部的第一初始位置。

需要说明的是，这里的第一初始位置可以是通过耳机的陀螺仪所获取的目标对象的头部的初始位置，也可以是当目标对象的头部在开始转动前，自定义将耳机中的陀螺仪的角度设置成一个角度，例如可以是0°，将该角度作为第一初始位置。具体的是直接获取第一初始位置，还是自定义设置一个第一初始位置可根据用户需求自行选取，这里不做限定。

目标声音信息可以是目标对象在第一初始位置处所接收到的声音。

第二初始位置可以是目标对象在第一初始位置处所接收到的声音的声源的位置。

具体的例如，以如下场景来描述这里的第一初始位置和第二初始位置：

目标对象(人)站在一个房间里，正面面对着阳台，当前(此时人的头部还没有开始转动)人站在房间的中心位置处，则房间的中心位置处即为目标对象的头部的第一初始位置。

在该房间内的阳台上有一个声音，该声音即为目标声音信息，此时人的耳朵可接收到该目标声音信息，人的耳朵听到的声音是从阳台上发出来的，则阳台即为第二初始位置。

可选的，在所述获取目标对象的头部的第一初始位置，以及与第一初始位置对应的目标声音信息的声源的第二初始位置之前，所述方法还包括：响应于对设置于目标对象的头部的耳机的开启触发操作，唤醒声音播放模块，以使声音播放模块播放目标声音信息。

示例性的，开启触发操作可以是对目标对象的头部的耳机所进行的开启耳机的操作。具体的通过语音或按键的方式来执行开启触发操作。

声音播放模块可以是任意一个可播放声音的设备，例如可以是扬声器、喇叭或手机语音助手(例如可以是小度、小爱或AirPods Pro)等。

当检测到对耳机的开启触发操作后，可响应于该开启触发操作，唤醒声音播放模块，以使声音播放模块可播放目标声音信息。

在声音播放模块响应时，此时目标对象的头部还没有开始转动，可通过耳机中的陀螺仪来获取当前位置(即第一初始位置)，也可以是当前陀螺仪的角度设置一个初始角度，例如可以是设置第一初始位置为初始角度0°。

当获取到第一初始位置后，可在目标对象的头部处于第一初始位置时，利用耳机获取通过声音播放模块播放的目标声音信息的位置，即第二初始位置。

这样设置的好处在于，可根据耳机中的设置的陀螺仪来获取第一初始位置和第二初始位置，不用额外多的设置获取第一初始位置和第二初始位置的设备，这样节省了成本。

S120、基于目标对象的头部在转动过程中的转动参数信息，确定目标对象的头部的当前位置相对于第一初始位置的角度参数信息。

示例性的，转动参数信息可以是目标对象的头部在转动过程中的转动信息。可选的，这里的转动参数信息可以但不限于是：角速度和加速度。

当前位置可以是目标对象的头部在转动的过程中，目标对象的头部转到某一位置处，该位置即为当前位置。

角度参数信息可以是目标对象的转动到某一位置处时，该位置相对于第一初始位置的相对角度信息。可选的，这里的角度参数信息可以但不限于是：目标对象的头部的当前位置相对于第一初始位置的水平方位角和垂直方位角。

在获取到第一初始位置和第二初始位置后，目标对象的头部从第一初始位置处开始转动，并实时获取目标对象的头部在转动过程中的转动参数信息，具体的可以是基于耳机中的陀螺仪来实时获取目标对象的头部在转动过程中的转动参数信息。

S130、基于角度参数信息，将声源的位置调整至第二初始位置处。

示例性的，根据确定的角度参数信息，利用一定的计算规则，可将目标声音信息的声源的位置调整值第二初始位置处。

在现有技术中，由于耳机佩戴在目标对象的头部，当目标对象的头部转动时，耳机也随着目标对象的头部的转动而转动，由于现在的耳机的设计都是让用户听到的声音是立体环声的，声音播放模块播放的目标声音信息不具备方位感，即目标对象的头部转动时，声音播放模块播放的声音随着目标对象的头部一起转动，即耳机中听到的目标声音信息是随着目标对象的头部的转动而转动的目标声音信息，这样不能将声音播放模块播放的目标声音信息的声源位置固定在同一位置，会让用户在感知上认为是和不同位置的人物在对话，语音交互不具有真实感。

在本发明实施例中，可在耳机中设置的一个音频处理单元，利用该音频处理单元，对角度参数信息进行一定的计算，可将目标声音信息的声源的位置调整至第二初始位置处，即随着目标对象的头部的转动，可将目标声音信息的声源的位置始终固定在声源的初始位置处，这样在目标对象的头部转动时，使声源的位置保持固定，在实际交互体验时，会让用户在感知上认为是和一个真实位置的人物进行对话，提升了用户体验。

在本发明实施例中，在基于角度参数信息，将声源的位置调整至第二初始位置处之后，所述方法还包括：响应于对耳机的结束控制操作，控制声音播放模块结束播放目标声音信息。

示例性的，结束控制操作可以是对目标对象的头部的耳机所进行的结束控制耳机的操作。具体的通过语音或按键的方式来执行结束控制操作。

当检测到对耳机的结束控制操作后，可响应于该结束控制操作，控制声音播放模块结束播放目标声音信息。此时耳机与声音播放模块的交互结束。

这样设置的好处在于，可通过响应对耳机的结束控制操作，来控制声音播放模块结束播放目标声音信息，实现了目标声音信息的结束播放的自动化控制。

实施例二

图2为本发明实施例二提供的声源位置定位方法的流程图，本发明实施例与上述实施例中各个可选方案可以结合。在本发明实施例中，可选的，所述基于所述角度参数信息，将声源的位置调整至所述第二初始位置处，包括：基于角度参数信息，确定目标对象接收目标声音信息的声音参数信息，重构声音参数信息，以将声源的位置调整至第二初始位置处。

如图2所示，本发明实施例的方法具体包括如下步骤：

S210、获取目标对象的头部的第一初始位置，以及与第一初始位置对应的目标声音信息的声源的第二初始位置。

S220、基于目标对象的头部在转动过程中的转动参数信息，确定目标对象的头部的当前位置相对于第一初始位置的角度参数信息。

S230、基于角度参数信息，确定目标对象接收目标声音信息的声音参数信息，重构声音参数信息，以将声源的位置调整至第二初始位置处。

示例性的，声音参数信息可以是目标对象接收的目标声音信息的参数信息，具体的这里的声音参数信息可以但不限于包括：目标对象的左耳和右耳接收到目标声音信息的时间差、声级差和双耳混响。

根据角度参数信息，可确定目标对象接收目标声音信息的声音参数信息，具体的可以是利用耳机中的陀螺仪的数据处理单元对角度参数信息进行一定的计算，即可确定目标对象接收目标声音信息的声音参数信息。

当计算出目标对象接收目标声音信息的声音参数信息后，可重构声音参数信息，生成新的左右耳音频流，将声源的位置调整值第二初始位置处，这样即可实现将声源的位置固定在一个位置处，让用户在感知上认为是和一个真实位置的人物进行对话，提升了用户体验。

可选的，这里的基于角度参数信息，将声源的位置调整至第二初始位置处，具体的可以是基于如下公式得到：

HL＝HL0(deltaDH，deltaDV)；

HR＝HR0(deltaDH，deltaDV)；

其中，HL0为目标对象的头部在转动之前，目标对象的左耳接收到的目标声音信息，HR0为目标对象的头部在转动之前，目标对象的右耳接收到的目标声音信息；deltaDH为目标对象的头部的当前位置相对于第一初始位置的水平方位角，deltaDV为目标对象的头部的当前位置相对于第一初始位置的垂直方位角；HL为将声源的位置调整至所述第二初始位置处时，目标对象所配置的耳机的左耳机输出的目标声音信息，HR为将声源的位置调整至所述第二初始位置处时，目标对象所配置的耳机的右耳机输出的目标声音信息。

需要说明的是，在通过上述公式将声源的位置调整至第二初始位置处的过程中，可基于上述公式得到目标对象接收目标声音信息的声音参数信息。

本发明实施例的技术方案，通过根据角度参数信息，来确定目标对象接收目标声音信息的声音参数信息，对确定的声音参数信息进行重构，以将声源的位置调整至第二初始位置处，这样即可实现将声源的位置固定在一个位置处，让用户在感知上认为是和一个真实位置的人物进行对话，提升了用户体验。

实施例三

本发明实施例与上述实施例中各个可选方案可以结合。在本发明实施例中，将本发明实施例的技术方案应用于实际场景中，在该场景中，在耳机中设置有陀螺仪，声音播放模块为语音助手，具体的参考图3所述的声源位置定位方法的执行流程图，将本发明实施例应用于实际场景中的具体实施步骤如下：

(1)耳机通过语音或按键唤醒手机语音助手。

(2)语音助手响应时，耳机设置陀螺仪当前位置为初始角度0度，即第一初始位置。

(3)在语音助手播报过程中，如果目标对象的头部产生运动，则陀螺仪(具体的可以是陀螺仪数据处理单元)可以检测到目标对象头部转动的转动参数信息，例如可以是加速度和角速度数据，从而计算出目标对象头部旋转的角度参数信息，例如可以是目标对象的头部的当前位置相对于第一初始位置的水平方位角和垂直方位角。

(4)耳机(具体的可以是耳机中的音频处理单元)根据步骤3计算出的目标对象的头部旋转的角度参数信息，根据角度参数信息，可确定出目标对象接收所述目标声音信息的声音参数信息，例如可以是目标对象的左耳和右耳接收到所述目标声音信息的时间差、声级差和双耳混响，重构左右耳接收到的语音助手的音频数据(即目标声音信息)，分别计算左右耳音频数据的时间差、声级差和双耳混响等参数，生成新的左右耳音频流，通过左右耳机的喇叭播放出来。

(5)随着用户头部运动，持续执行步骤4操作和运算。

(6)响应于对耳机的结束控制操作，控制语音助手结束播放目标声音信息，语音助手交互结束，陀螺仪数据处理单元和音频处理单元结束本次控制操作。

通过以上流程，即可完成通过蓝牙耳机上利用陀螺仪控制语音助手发声位置定位的方法，使用户感知到语音助手的发声位置仍然位于初始的发声位置。

实施例四

图4为本发明实施例四提供的声源位置定位装置的结构示意图，如图4所示，该装置包括：初始位置获取模块31、角度参数信息确定模块32和声源位置定位模块33。

其中，初始位置获取模块31，用于获取目标对象的头部的第一初始位置，以及与所述第一初始位置对应的目标声音信息的声源的第二初始位置；

角度参数信息确定模块32，用于基于目标对象的头部在转动过程中的转动参数信息，确定所述目标对象的头部的当前位置相对于所述第一初始位置的角度参数信息；

声源位置定位模块33，用于基于所述角度参数信息，将声源的位置调整至所述第二初始位置处。

在本发明实施例的技术方案基础上，该装置还包括：

目标声音信息播放模块，用于响应于对设置于所述目标对象的头部的耳机的开启触发操作，唤醒声音播放模块，以使所述声音播放模块播放目标声音信息。

在本发明实施例的技术方案基础上，声源位置定位模块33包括：

声音参数信息确定单元，用于基于所述角度参数信息，确定所述目标对象接收所述目标声音信息的声音参数信息，其中，所述声音参数信息包括目标对象的左耳和右耳接收到所述目标声音信息的时间差、声级差和双耳混响；

声源位置定位单元，用于重构所述声音参数信息，以将所述声源的位置调整至所述第二初始位置处。

可选的，所述角度参数信息包括：所述目标对象的头部的当前位置相对于所述第一初始位置的水平方位角和垂直方位角。

在本发明实施例的技术方案基础上，声源位置定位模块33具体用于：

根据如下公式，基于所述角度参数信息，将声源的位置调整至所述第二初始位置处：

HL＝HL0(deltaDH，deltaDV)；

HR＝HR0(deltaDH，deltaDV)；

可选的，所述耳机中设置有陀螺仪。

对应的，在本发明实施例的技术方案基础上，该装置还包括：

转动参数信息获取模块，用于基于所述陀螺仪获取目标对象的头部在转动过程中的转动参数信息。

在本发明实施例的技术方案基础上，该装置还包括：

目标声音信息结束播放模块，用于响应于对所述耳机的结束控制操作，控制所述声音播放模块结束播放所述目标声音信息。

可选的，所述转动参数信息至少包括：角速度和加速度。

本发明实施例所提供的声源位置定位装置可执行本发明任意实施例所提供的声源位置定位方法，具备执行方法相应的功能模块和有益效果。

实施例五

图5为本发明实施例五提供的一种电子设备的结构示意图，如图5所示，该电子设备包括处理器70、存储器71、输入装置72和输出装置73；电子设备中处理器70的数量可以是一个或多个，图5中以一个处理器70为例；电子设备中的处理器70、存储器71、输入装置72和输出装置73可以通过总线或其他方式连接，图5中以通过总线连接为例。

存储器71作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的声源位置定位方法对应的程序指令/模块(例如，初始位置获取模块31、角度参数信息确定模块32和声源位置定位模块33)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块，从而执行电子设备的各种功能应用以及数据处理，即实现上述的声源位置定位方法。

存储器71可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器71可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器71可进一步包括相对于处理器70远程设置的存储器，这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置72可用于接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。

实施例六

本发明实施例六还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种声源位置定位方法。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的声源位置定位方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机电子设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述声源位置定位装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种声源位置定位方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述获取目标对象的头部的第一初始位置，以及与所述第一初始位置对应的目标声音信息的声源的第二初始位置之前，所述方法还包括：

响应于对设置于所述目标对象的头部的耳机的开启触发操作，唤醒声音播放模块，以使所述声音播放模块播放目标声音信息。

3.根据权利要求1所述的方法，其特征在于，所述基于所述角度参数信息，将声源的位置调整至所述第二初始位置处，包括：

基于所述角度参数信息，确定所述目标对象接收所述目标声音信息的声音参数信息，其中，所述声音参数信息包括目标对象的左耳和右耳接收到所述目标声音信息的时间差、声级差和双耳混响；

重构所述声音参数信息，以将所述声源的位置调整至所述第二初始位置处。

4.根据权利要求1所述的方法，其特征在于，所述角度参数信息包括：所述目标对象的头部的当前位置相对于所述第一初始位置的水平方位角和垂直方位角；

所述基于所述角度参数信息，将声源的位置调整至所述第二初始位置处，包括：

HL＝HL0(deltaDH，deltaDV)；

HR＝HR0(deltaDH，deltaDV)；

5.根据权利要求2所述的方法，其特征在于，所述耳机中设置有陀螺仪；所述方法，还包括：

基于所述陀螺仪获取目标对象的头部在转动过程中的转动参数信息。

6.根据权利要求2所述的方法，其特征在于，在所述基于所述角度参数信息，将声源的位置调整至所述第二初始位置处之后，所述方法还包括：

响应于对所述耳机的结束控制操作，控制所述声音播放模块结束播放所述目标声音信息。

7.根据权利要求1所述的方法，其特征在于，所述转动参数信息至少包括：角速度和加速度。

8.一种声源位置定位装置，其特征在于，包括：

9.一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的声源位置定位方法。

10.一种包含计算机可执行指令的存储介质，其特征在于，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的声源位置定位方法。