CN110082726A - 声源定位方法及装置、定位设备及存储介质 - Google Patents

声源定位方法及装置、定位设备及存储介质 Download PDF

Info

Publication number
CN110082726A
CN110082726A CN201910285743.0A CN201910285743A CN110082726A CN 110082726 A CN110082726 A CN 110082726A CN 201910285743 A CN201910285743 A CN 201910285743A CN 110082726 A CN110082726 A CN 110082726A
Authority
CN
China
Prior art keywords
information
location information
mould group
voice signal
acquisition mould
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910285743.0A
Other languages
English (en)
Other versions
CN110082726B (zh
Inventor
王永亮
任伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wutong Chelian Technology Co Ltd
Original Assignee
Beijing Wutong Chelian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wutong Chelian Technology Co Ltd filed Critical Beijing Wutong Chelian Technology Co Ltd
Priority to CN201910285743.0A priority Critical patent/CN110082726B/zh
Publication of CN110082726A publication Critical patent/CN110082726A/zh
Application granted granted Critical
Publication of CN110082726B publication Critical patent/CN110082726B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Stereophonic System (AREA)

Abstract

本发明实施例公开一种声源定位方法及装置、定位设备及存储介质。所述方法声源定位方法,包括:利用第一采集模组和与第一采集模组间距设置的第二采集模组,分别采集第一语音信号得到所述第一语音信号的声源的第一定位信息;根据所述第一语音信号的声纹特征识别出承载对象的身份信息;基于所述身份信息,获取所述承载对象的位置偏好信息;根据所述位置偏好信息校正所述第一定位信息,获得第二定位信息。

Description

声源定位方法及装置、定位设备及存储介质
技术领域
本发明涉及信息技术领域,尤其涉及一种声源定位方法及装置、定位设备及存储介质。
背景技术
在具有承载空间的移动装置内,可能设置有多个承载位,这些承载位的承载对象都有可能会采用语音控制承载空间内的设备的需求。但是不同的承载对象可能控制的是不同位置的受控设备,这样就需要区分来自不同承载位的承载对象的声源,但是目前声源定位有精确度不够的问题。
发明内容
有鉴于此,本发明实施例期望提供一种声源定位方法及装置、定位设备及存储介质。
本发明的技术方案是这样实现的:
一种声源定位方法,包括:
利用第一采集模组和与第一采集模组间距设置的第二采集模组,分别采集第一语音信号得到所述第一语音信号的声源的第一定位信息;
根据所述第一语音信号的声纹特征识别出承载对象的身份信息;
基于所述身份信息,获取所述承载对象的位置偏好信息;
根据所述位置偏好信息校正所述第一定位信息,获得第二定位信息。
基于上述方案,所述根据所述座次偏好信息校正所述第一定位信息,获得第二定位信息,包括:
若所述第一定位信息指示所述声源位于预定范围内,根据所述位置偏好信息校正所述第一定位信息获得所述第二定位信息。
基于上述方案,所述方法还包括:
若所述第一定位信息指示所述声源位于所述预定范围外,将所述第一定位信息作为最终定位的所述第二定位信息。
基于上述方案,所述基于所述身份信息,获取所述承载对象的位置偏好信息,包括:
基于所述身份信息,获取当前时间以前的预定时长范围内所述承载对象出现在移动装置的承载空间内各承载位的频次信息。
基于上述方案,所述方法还包括:
根据辅助信息,确定移动装置的承载空间内的承载对象的数目;
所述利用第一采集模组和与第一采集模组间距设置的第二采集模组,分别采集第一语音信号得到所述第一语音信号的声源的第一定位信息,包括:
若所述承载对象的数目大于1,利用所述第一采集模组和所述第二采集模组分别采集所述第一语音信号得到所述第一语音信号的所述第一定位信息。
基于上述方案,所述方法还包括:
若所述承载对象数目为1,根据所述承载对象所在的承载位确定所述第一语音信号的定位信息。
基于上述方案,所述辅助信息包括以下至少之一:
获取所述承载空间内安全设施的使用状态信息;
获取所述承载空间内承载位的载重信息;
获取所述承载空间的图像信息。
一种声源定位装置,包括:
采集模块,用于利用第一采集模组和与第一采集模组间距设置的第二采集模组,分别采集第一语音信号得到所述第一语音信号的声源的第一定位信息;
识别模块,用于根据所述第一语音信号的声纹特征识别出承载对象的身份信息;
获取模块,用于基于所述身份信息,获取所述承载对象的位置偏好信息;
校正模块,用于根据所述位置偏好信息校正所述第一定位信息,获得第二定位信息。
一种电子设备,包括:
音频采集模组,
存储器;
处理器,分别与所述音频采集模组及所述存储器连接,用于通过执行位于所述存储器上的计算机可执行指令,能够根据所述音频采集模组所采集的音频实现前述任意技术方案提供的声源定位方法。
一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被处理器执行后,能够实现前述任意技术方案提供的声源定位方法。
本发明实施例提供的技术方案,在利用第一采集模组和第二采集模组进行第一语音信号的声源定位时,还会识别该第一语音信号得到声纹特征,基于声纹特征知道该声源(承载对象)的身份信息,得到该承载对象的位置偏好信息;结合位置偏好信息校正所述第一定位信息,得到更加精确的第二定位信息;如此,后续电子设备在提供基于声源定位的服务时,可以实现精准控制,减少误操作,并提升用户体验。
附图说明
图1为本发明实施例提供一种声源定位方法的流程示意图;
图2为本发明实施例提供的一种基于第一采集模组和第二采集模组的定位效果示意图;
图3为本发明实施例提供的另一种基于第一采集模组和第二采集模组的定位效果示意图;
图4为本发明实施例提供的另一种声源定位方法的流程示意图;
图5为本发明实施例提供一种声源定位装置的结构示意图;
图6为本发明实施例提供的另一种声源定位装置的结构示意图;
图7为本发明实施例提供的再一种声源定位方法的流程示意图。
具体实施方式
以下结合说明书附图及具体实施例对本发明的技术方案做进一步的详细阐述。
如图1所示,本实施例提供一种声源定位方法,包括:
步骤S110:利用第一采集模组和与第一采集模组间距设置的第二采集模组,分别采集第一语音信号得到所述第一语音信号的声源的第一定位信息;
步骤S120:根据所述第一语音信号的声纹特征识别出承载对象的身份信息;
步骤S130:基于所述身份信息,获取所述承载对象的位置偏好信息;
步骤S140:根据所述位置偏好信息校正所述第一定位信息,获得第二定位信息。
本实施例提供一种声源定位方法,可以用于移动装置内的声源定位。
该移动装置包括各种交通工具、例如,汽车、私人游艇等。
所述移动装置可包括:
移动装置;
壳体,安装在所述移动装置上,具有承载空间。
在所述承载空间内设置有一个或多个承载位,这些承载位将所述承载空间划分为多个子空间。这些子空间可以相互隔离,也可以相互连通;但是这些子空间位于所述承载空间内的不同部分。
在本实施例中,所述承载空间可为一个相对封闭的空间,例如,以汽车为例,在车厢上设置有车门;若车门打开,车厢与车厢外联通,与外界形成了联通空间;若车门关闭,车厢与车厢外进行了隔离。在一个相对封闭隔离的承载空间内,声音可能会出现多次反射,声音传播的路径被改变,且容易产生回音;从而产生回音干扰。
在本实施例中,所述第一采集模组和第二采集模组都可为位于承载空间内不同位置上的声音采集设备,例如,麦克风。该麦克风可以采集声音。
如图2和图3所示,所述第一采集模组和第二采集模组可以设置在移动空间的同一个平面内的不同位置。
在图2和图3中,第一采集模组和第二采集模组之间的间距为d,第一采集模组和第二采集模组的连线作为确定声源相对于两个采集模组的角度的一条边。当然表征所述声源相对于采集模组的定位信息的方式有很多种,不局限于图2和图3的表示方式。参考图2和图3可知:声源位于不同的位置,得到所述第一定位信息对应的角度θ不同,若θ大于0°且小于90°表示声源位于左边;若θ大于等于90°且小于180°表示声源位于右边。
例如,所述移动装置为汽车,则所述第一采集模组和第二采集模组可以间隔设置在汽车的车厢内的主驾位和副驾位之前的壳体上。
由于第一采集模组和第二采集模组间隔设置,如此,从同一个声源发出的声音达到两个采集模组的参数不同,使得第一采集模组和第二采集模组采集的同一个第一语音信号的音频参数不同。此处的音频参数包括但不限于:第一语音信号的接收方向、相对于对应采集模组的接收角度及接收时间等参数中的一个或多个。
通过第一语音信号的多径接收,可以定位出所述第一语音信号的声源的位置,得到所述第一定位信息。
利用两种采集模组精确定位声源的过程中,若声源离两个采集模组比较近,再加上在承载空间这种相对封闭的空间,会产生声音信号的反射或回音,会影响第一语音信号的声源定位的准确性时,在本实施例中会通过声纹识别的方式,从第一语音信号中提取出声纹特征,从而基于声纹特征识别产生所述第一语音信号的承载对象的身份信息。
通过声纹特征识别可以得到所述第一语音信号对应的以下声纹特征之一:
声学特征,例如,声波频率、声波导频率、声波的共振峰,这些体现了不同承载对象的发声时的声学特点;
词法特征,不同的用户具有不同的用词习惯,词法特征至少可以辅助识别身份;
口音特征,不同的用户不同的口音。
总之,在本实施例中,设备会根据第一语音信号的声纹特征识别出承载对象的身份信息。
在发出所述第一语音信号的承载对象的身份被识别之后,可以结合该承载对象的位置偏好信息,来精确定位承载对象的定位信息,例如,从而得到所述第二定位信息。
例如,以该移动装置为私家车为例,在一个私家车,家庭成员为该私家车的常用承载对象;不同的家庭成员在私家车内具有一定的习惯坐席。例如,爸爸可能常出现在主驾上,幼龄子女比较常出现在后排坐席上,而这些都是可以利用位置偏好信息来表达的。
在本实施例中,为了精确识别所述声源的位置信息,会通过声纹特征的识别得到作为所述声源的承载对象的身份信息之后,根据该承载对象的位置偏好信息对当前识别出的第一定位信息进行校正,从而获得更加精确的定位信息,提高车内声源定位的精确度。
所述第一语音信号可为移动装置内电子设备的唤醒语音信号。该唤醒语音信号可以用于触发处于第一状态的电子设备切换到第二状态。电子设备在第一状态下的功耗低于在第二状态下的功耗。所述第一状态包括但不限于:休眠状态。所述第二状态包括但不限于激活状态。
在一些实施例中,所述第一语音信号还可包括:指令信号;该指令信号控制移动装置内进入到第二状态的电子设备执行功能操作。
该功能操作包括但不限于:
播放对应的多媒体信息,该多媒体信息包括但不限于:音频信息、视频信息;
调整对应承载坐席的坐席参数,例如,该坐席参数包括但不限于以下至少之一:坐席高度、坐席倾斜度、坐席上安全设施的状态;该坐席所对应的窗户的开关状态、该坐席的环境调控装置的调控参数。所述环境调控装置包括但不限于:加热器、空调、加湿器、空空气清新器等。调控参数包括:环境调控装置的工作参数,例如,空调的运行功率、目标温度等;再例如,坐席加热的加热功率。
总之,本实施例中所述第一语音信号可为各种触发移动装置内电子设备执行一定操作的语音信号。
在本实施例中,在确定出所述声源的第二定位信息之后,结合所述第二定位信息控制所述移动装置执行与该第二定位信息所指向的承载位相关的功能操作。该功能操作包括但不限于:加热对应的承载位、对对应的承载位进行降温、控制对应承载位上的多媒体设备打开或关闭,控制对应承载位上的多媒体设备播放所述第一语音信号所指示的多媒体信息等。
在一些实施例中,所述步骤S140可包括步骤S141;所述步骤S141可包括:
若所述第一定位信息指示所述声源位于预定范围内,根据所述位置偏好信息校正所述第一定位信息获得所述第二定位信息。
在一些场景下,第一采集模组和第二采集模组是可以精确定位所述声源的位置的,若指示声源在预定范围内,则精确度会大大的降低。
故在本实施例中,若发现第一采集模组和第二采集模组定位出声源在预定范围内,则此时第一采集模组和第二采集模组的定位并不精确,需要通过声纹特征识别得到身份信息之后辅助定位声源。
在本实施例中,所述预定范围可为角度范围或距离范围。所述距离范围可为距离所述第一采集模组和第二采集模组连线中点的距离,该距离范围包括距离上限,例如,30cm、40cm等距离范围。
所述角度范围可为:以所述第一采集模组和第二采集模组的连线为角度的一条边,定位出的声源与所述第一采集模组和第二采集模组其中一个与其较近的采集模组之间线所形成的角度。该预定角度范围可为:50度到130度;或者,55度到125度之间等角度。
此时,步骤S140才会执行根据位置偏好信息来校正第一位置信息得到第二位置信息,否则可以直接将第一位置信息作为声源的最终定位信息输出。
在一些实施例中,所述方法还包括:在所述第一定位信息指示所述声源位于所述预定范围内时,才提取所述第一语音信号的声纹特征,并得到所述身份信息;如此,减少不必要的身份识别及位置偏好信息的获取,以减少所述移动装置内电子设备的工作负荷。
具体如,所述步骤S140可包括:
若所述位置偏好信息和所述第一定位信息指向同一个承载位,则根据所述位置偏好信息和/或第一定位信息中任意一个得到所述第二定位信息;
若所述位置偏好信息和所述第一定位信息指向了不同的承载位,根据所述位置偏好信息确定所述第二定位信息;此时,位置偏好信息的优先级是高于第一定位信息的优先级的。
在一些实施例中,如图4所示,所述方法还包括:
步骤S150:若所述第一定位信息指示所述声源位于所述预定范围外,将所述第一定位信息作为最终定位的所述第二定位信息。
在一些实施例中,所述方法还包括:
若第一定位信息指示声原位于预定范围外,但是通过声纹特征识别发现该第一语音信号的承载对象身份信息,得到该特定时长之前定位的历史定位信息与所述第一定位信息不同,结合所述位置偏好信息和/或所述历史定位信息综合确定该声源的第二定位信息。
例如,以汽车为例,用户在汽车内会活动,例如改变自己的脸部朝向,或者后排乘客向前排乘客靠近等,若此时检测到的第一语音信号定位得到的第一定位信息虽然位于预定范围外,定位精确,但是实质上该乘客并非想要操控其他坐席改变。具体如,后排某一乘客弯曲身子和前排乘客说话时,给移动装置内的电子设备发出了指令;若基于第一采集模组和第二采集模组的定位,虽然得到一个精确定位信息,该定位信息将后排座位的声源识别为了前排座位的声源,此时,若按照该精确定位的第一定位信息直接控制移动装置执行特定的操作,可能是会对前排坐席执行对应的操作,例如,调整前排坐席的坐席参数等,但是这种操作依然是误操作。
故进一步优化,本实施例提供的方法还会获取特定时长内该身份信息对应的历史定位信息,若在1分钟前或2分钟前,该身份信息对应的生源位于后排坐席,则该声源位于后排坐席的概率更高;故此时同样会结合历史定位信息和/或位置偏好信息,最终确定得到所述第二定位信息。
在一些实施例中,若特定时长内的历史定位信息和第一定位信息指向的承载位不同时,还会结合移动装置的状态信息,确定是直接基于第一定位信息确定声源定位,还是会需要考虑历史定位信息和/或位置偏好信息综合进行声源定位。
具体如,所述移动装置的状态信息表明:在该特定时长内移动装置未停止移动,则车内承载对象(包括但不限于乘客)更换承载位(坐席)的概率很小,则此时第一定位信息和历史定位信息的这种冲突,可能就是由于承载对象在承载空间内的移动导致的。
在一些实施例中,所述步骤S130可包括:基于所述身份信息,获取当前时间以前的预定时长范围内所述承载对象出现在移动装置的承载空间内各承载位的频次信息。
所述位置偏好信息包括频次信息,该频次信息可以指示出承载对象在各承载位的出现频次,出现频次越高的承载位,说明承载对象在该承载位出现的概率越高。
故在步骤S130中可以将所述频次信息作为所述位置偏好信息,在步骤S140中进行所述第一定位信息的校正。
在还有一些实施例中,所述位置偏好信息还可包括:根据所述频次信息得到的承载对象最常出现的承载位的位置标识。
在一些实施例中,所述方法还包括:
根据辅助信息,确定移动装置的承载空间内的承载对象的数目;
所述步骤S110可包括:
若所述承载对象的数目大于1,利用所述第一采集模组和所述第二采集模组分别采集所述第一语音信号得到所述第一语音信号的所述第一定位信息。
在本实施例中,所述辅助信息可为所述移动装置的各种传感器传感的传感信息。
该传感信息可以用于确定目前承载空间内的承载对象的数目。
例如,该移动装置内仅有一个承载对象时,则该语音信号可认定就是来自该承载对象,此时为了节省电子设备的功耗,降低电子设备的工作负荷,可以不用执行所述步骤S110至步骤S140。
但是若承载对象大于1,则可能需要区分当前产生所述语音信号的声源所在的位置。故在本实施例中,在承载对象大于1时,才利用第一采集模组和第二采集模组分别采集第一语音信号得到第一定位信息。
所述辅助信息包括但不限于:
承载位上的承重信息,承载位上是否与承载对象,位于承载位上的压力传感器等检测的压力值不同的;
获取所述承载空间内安全设施的使用状态信息,此处的,安全设施包括但不限于安全带、儿童安全座椅的座椅护栏;该使用状态信息指示安全设施在使用中,说明对应的承载位上具有承载对象;
获取所述承载空间的图像信息。例如,利用车内摄像头采集了图像,通过图像分析可以知道车厢内哪些坐席上有乘客及乘客的数量等。
总之,所述辅助信息有很多种,具体的实现时,不局限于上述任意一种。
如图5所示,本实施例提供一种声源定位装置,包括:
采集模块101,用于利用第一采集模组和与第一采集模组间距设置的第二采集模组,分别采集第一语音信号得到所述第一语音信号的声源的第一定位信息;
识别模块102,用于根据所述第一语音信号的声纹特征识别出承载对象的身份信息;
获取模块103,用于基于所述身份信息,获取所述承载对象的位置偏好信息;
校正模块104,用于根据所述位置偏好信息校正所述第一定位信息,获得第二定位信息。
在一些实施例中,该声源定位装置提供的采集模组、识别模块102、获取模块103及校正模块104均可为程序模块,该程序模块被处理器执行后,能够实现前述各个模块的对应功能。
在还有一些实施例中,所述采集模组、识别模块102、获取模块103及校正模块104可为软硬结合模块;所述软硬结合模块包括但不限于各种可编程阵列;所述可编程阵列包括但不限于:复杂可编程阵列或者现场可编程阵列。
在另外一些实施例中,所述采集模组、识别模块102、获取模块103及校正模块104可为纯硬件模块,该纯硬件模块包括但不限于专用集成电路等。
在一些实施例中,所述校正模块104,具体用于若所述第一定位信息指示所述声源位于预定范围内,根据所述位置偏好信息校正所述第一定位信息获得所述第二定位信息。
在一些实施例中,所述装置还包括:
定位模块,用于若所述第一定位信息指示所述声源位于所述预定范围外,将所述第一定位信息作为最终定位的所述第二定位信息。
在一些实施例中,所述获取模块103,具体用于基于所述身份信息,获取当前时间以前的预定时长范围内所述承载对象出现在移动装置的承载空间内各承载位的频次信息。
在一些实施例中,所述装置还包括:
第一确定模块,用于根据辅助信息,确定移动装置的承载空间内的承载对象的数目;
所述采集模块101,具体用于若所述承载对象的数目大于1,利用所述第一采集模组和所述第二采集模组分别采集所述第一语音信号得到所述第一语音信号的所述第一定位信息。
在一些实施例中,第二确定模块,用于若所述承载对象数目为1,根据所述承载对象所在的承载位确定所述第一语音信号的定位信息。
在一些实施例中,所述辅助信息包括以下至少之一:
获取所述承载空间内安全设施的使用状态信息;
获取所述承载空间内承载位的载重信息;
获取所述承载空间的图像信息。
以下结合上述任意实施例提供几个具体示例:
示例1:
本示例提供一种能够实现前述声源定位方法的声源定位装置,具体可参考图6所示,包括:
音频采集器:通过车内麦克风录入用户的音频语料,至少2个麦克风。
声纹特征提取模型:基于声纹识别技术,采集用户所说的唤醒词音频文件,通过音频特征提取(比如MFCC特征提取算法)分类不同用户。
通常使用唤醒词进行声纹识别。此处的音频采集器即为前述的第一采集模组和/或第二采集模组。
声源定位分类器:对于一定时间范围内,该一定时间范围可建议1天或半天、2个小时或者1个小时等,统计该分类用户所说每条语料的方位来源的次数概率,从而判定该用户所在的偏好位置;基于数据统计,如果左边的概率远大于右边的概率,即偏好为主驾;如果左边的概率远小于右边的概率,即偏好为副驾。
语音识别引擎:识别出语音,例如,语音识别唤醒词;
语音检测模型(vad):检测车内是否有声音、标记声音的开始与结束;
声源定位决策模型:通过声源定位DOA技术获取声源的角度θ。如果角度θ较远于中值90°(比如如果以主驾为起点,对于主驾人员θ在50°左右;副驾人员θ在130°左右),即为合理角度,识别准确,将判定结果汇报给声源定位分类器。此处的合理角度即为前述的预定角度范围外的一种示例。如果角度θ接近于中值90°(比如85°≤θ<90°和90≤θ≤95°),即为偏差角度,如此会存在角度识别误差。此处的偏差角度即为前述的预设范围内的一种示例。
这种情况下,如果主副驾座位,只有一人,即直接给予定位结果。可以通过检测安全带被系情况:如果只有主驾座安全带被系,则声源定位为主驾;如果只有副驾安全带被系,则声源定位为副驾。
如果主副驾均有用户,基于声源定位分类器,进一步判断用户的定位偏好,得到声源是位于主驾或者副驾的判定结果。
如此,通过唤醒词的音频文件,提取声纹特征,识别不同的用户,特别适用于家庭人员不同的坐车习惯;
通过声源定位决策模型,对于识别出的声源角度存在误差(太接近中值),不再直接取声源定位的值,而是通过与声源定位分类器联动,给与用户所在方位的偏好。该策略极大提高了声源定位的决策速度,并且避免了回声干扰和声音反射导致角度加权收敛计算出现偏差,从而造成左右定位与实际相反。同一台汽车的使用者,通过声纹特征进行分类,确定每个用户坐车选择位置的习惯,从而更智能化、更准确的提供基于声源定位的语音交互。基于位置偏好,可以快速给与用户方位判断,减少了音频采集及判定时间。
示例2:
如图7所示,本示例提供一种声源定位方法,包括:
语音录入;
提取声纹特征,识别出用户身份;
首次认证,设置偏好位置信息是主驾;
声源定位获取声源的角度θ;
确定角度θ是否接近中值90°,
若是,识别角度θ存在误差;
若否,识别角度θ合理;
若存在误差,确定主副驾左是否只有一人;
若是只有一人,获取用户所在的位置,直接根据主驾或副驾上的单一用户确定声源;
若不是只有一人,利用检索分类器,获取用户的偏好位置,结合偏好位置确定声源来自主驾还是副驾。
若不存在误差,确定识别的角度θ合理,利用分类器基于该合理的角度θ记录用户的偏好位置,该记录可以用于辅助后续的坐席判断。
本实施例还提供一种电子设备,包括:
音频采集模组,
存储器;
处理器,分别与所述音频采集模组及所述存储器连接,用于通过执行位于所述存储器上的计算机可执行指令,能够根据所述音频采集模组所采集的音频实现前述任意技术方案提供的声源定位方法,例如,如图1、图4及图7所示方法的至少其中之一。
所述音频采集模组对应于前述第一采集模组和第二采集模组,包括但不限于麦克风。
所述存储器可为各种包括计算机存储介质的存储器件,该计算机存储介质可为非瞬间存储介质。
所述处理器可为各种类型的处理器,例如,中央处理器、微处理器、可编程阵列或者数字信号处理等。
所述处理器可以通过总线等结构,分别与所述音频采集模组及存储器连接,控制所述音频采集模组及所述存储器的工作状态。
本实施例还提供一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被处理器执行后,能够实现前述任意技术方案提供的声源定位方法,例如,如图1、图4及图7所示方法的至少其中之一。
该计算机存储介质可包括非瞬间存储介质,例如,闪存(flash)等。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种声源定位方法,其特征在于,包括:
利用第一采集模组和与第一采集模组间距设置的第二采集模组,分别采集第一语音信号得到所述第一语音信号的声源的第一定位信息;
根据所述第一语音信号的声纹特征识别出承载对象的身份信息;
基于所述身份信息,获取所述承载对象的位置偏好信息;
根据所述位置偏好信息校正所述第一定位信息,获得第二定位信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述座次偏好信息校正所述第一定位信息,获得第二定位信息,包括:
若所述第一定位信息指示所述声源位于预定范围内,根据所述位置偏好信息校正所述第一定位信息获得所述第二定位信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若所述第一定位信息指示所述声源位于所述预定范围外,将所述第一定位信息作为最终定位的所述第二定位信息。
4.根据权利要求2所述的方法,其特征在于,所述基于所述身份信息,获取所述承载对象的位置偏好信息,包括:
基于所述身份信息,获取当前时间以前的预定时长范围内所述承载对象出现在移动装置的承载空间内各承载位的频次信息。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
根据辅助信息,确定移动装置的承载空间内的承载对象的数目;
所述利用第一采集模组和与第一采集模组间距设置的第二采集模组,分别采集第一语音信号得到所述第一语音信号的声源的第一定位信息,包括:
若所述承载对象的数目大于1,利用所述第一采集模组和所述第二采集模组分别采集所述第一语音信号得到所述第一语音信号的所述第一定位信息。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述承载对象数目为1,根据所述承载对象所在的承载位确定所述第一语音信号的定位信息。
7.根据权利要求5所述的方法,其特征在于,所述辅助信息包括以下至少之一:
获取所述承载空间内安全设施的使用状态信息;
获取所述承载空间内承载位的载重信息;
获取所述承载空间的图像信息。
8.一种声源定位装置,其特征在于,包括:
采集模块,用于利用第一采集模组和与第一采集模组间距设置的第二采集模组,分别采集第一语音信号得到所述第一语音信号的声源的第一定位信息;
识别模块,用于根据所述第一语音信号的声纹特征识别出承载对象的身份信息;
获取模块,用于基于所述身份信息,获取所述承载对象的位置偏好信息;
校正模块,用于根据所述位置偏好信息校正所述第一定位信息,获得第二定位信息。
9.一种电子设备,包括:
音频采集模组,
存储器;
处理器,分别与所述音频采集模组及所述存储器连接,用于通过执行位于所述存储器上的计算机可执行指令,能够根据所述音频采集模组所采集的音频实现权利要求1至7任一项提供的方法。
10.一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被处理器执行后,能够实现权利要求1至7任一项提供的方法。
CN201910285743.0A 2019-04-10 2019-04-10 声源定位方法及装置、定位设备及存储介质 Active CN110082726B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910285743.0A CN110082726B (zh) 2019-04-10 2019-04-10 声源定位方法及装置、定位设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910285743.0A CN110082726B (zh) 2019-04-10 2019-04-10 声源定位方法及装置、定位设备及存储介质

Publications (2)

Publication Number Publication Date
CN110082726A true CN110082726A (zh) 2019-08-02
CN110082726B CN110082726B (zh) 2021-08-10

Family

ID=67414666

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910285743.0A Active CN110082726B (zh) 2019-04-10 2019-04-10 声源定位方法及装置、定位设备及存储介质

Country Status (1)

Country Link
CN (1) CN110082726B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112466325A (zh) * 2020-11-25 2021-03-09 Oppo广东移动通信有限公司 声源定位方法和装置,及计算机存储介质
CN112655000A (zh) * 2020-04-30 2021-04-13 华为技术有限公司 车内用户定位方法、车载交互方法、车载装置及车辆
CN112799019A (zh) * 2021-01-26 2021-05-14 安徽淘云科技股份有限公司 声源定位方法、装置、电子设备及存储介质
CN112925235A (zh) * 2021-01-21 2021-06-08 深圳市普渡科技有限公司 交互时的声源定位方法、设备和计算机可读存储介质
CN114359390A (zh) * 2022-01-10 2022-04-15 中国计量科学研究院 一种基于图像的鸣笛检测***声源定位偏差估计方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101438604A (zh) * 2004-12-02 2009-05-20 皇家飞利浦电子股份有限公司 使用扬声器作为麦克风的位置感知
CN102819009A (zh) * 2012-08-10 2012-12-12 汽车零部件研究及发展中心有限公司 用于汽车的驾驶者声源定位***及方法
CN104575493A (zh) * 2010-05-26 2015-04-29 谷歌公司 使用地理信息的声学模型适配
CN105913844A (zh) * 2016-04-22 2016-08-31 乐视控股(北京)有限公司 车载语音获取方法及装置
US20170213459A1 (en) * 2016-01-22 2017-07-27 Flex Ltd. System and method of identifying a vehicle and determining the location and the velocity of the vehicle by sound
CN107249954A (zh) * 2014-12-29 2017-10-13 罗伯特·博世有限公司 用于使用个性化驾驶简档操作自主车辆的***和方法
CN107465986A (zh) * 2016-06-03 2017-12-12 法拉第未来公司 使用多个麦克风检测和隔离车辆中的音频的方法和装置
CN107521434A (zh) * 2016-06-16 2017-12-29 福特全球技术公司 用于车辆乘员位置检测的方法和设备
CN109218859A (zh) * 2017-06-29 2019-01-15 长城汽车股份有限公司 车载定向音响***、控制方法及车辆
CN109389978A (zh) * 2018-11-05 2019-02-26 珠海格力电器股份有限公司 一种语音识别方法及装置
CN109493871A (zh) * 2017-09-11 2019-03-19 上海博泰悦臻网络技术服务有限公司 车载***的多屏语音交互方法及装置、存储介质和车机

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101438604A (zh) * 2004-12-02 2009-05-20 皇家飞利浦电子股份有限公司 使用扬声器作为麦克风的位置感知
CN104575493A (zh) * 2010-05-26 2015-04-29 谷歌公司 使用地理信息的声学模型适配
CN102819009A (zh) * 2012-08-10 2012-12-12 汽车零部件研究及发展中心有限公司 用于汽车的驾驶者声源定位***及方法
CN107249954A (zh) * 2014-12-29 2017-10-13 罗伯特·博世有限公司 用于使用个性化驾驶简档操作自主车辆的***和方法
US20170213459A1 (en) * 2016-01-22 2017-07-27 Flex Ltd. System and method of identifying a vehicle and determining the location and the velocity of the vehicle by sound
CN105913844A (zh) * 2016-04-22 2016-08-31 乐视控股(北京)有限公司 车载语音获取方法及装置
CN107465986A (zh) * 2016-06-03 2017-12-12 法拉第未来公司 使用多个麦克风检测和隔离车辆中的音频的方法和装置
CN107521434A (zh) * 2016-06-16 2017-12-29 福特全球技术公司 用于车辆乘员位置检测的方法和设备
CN109218859A (zh) * 2017-06-29 2019-01-15 长城汽车股份有限公司 车载定向音响***、控制方法及车辆
CN109493871A (zh) * 2017-09-11 2019-03-19 上海博泰悦臻网络技术服务有限公司 车载***的多屏语音交互方法及装置、存储介质和车机
CN109389978A (zh) * 2018-11-05 2019-02-26 珠海格力电器股份有限公司 一种语音识别方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112655000A (zh) * 2020-04-30 2021-04-13 华为技术有限公司 车内用户定位方法、车载交互方法、车载装置及车辆
CN112466325A (zh) * 2020-11-25 2021-03-09 Oppo广东移动通信有限公司 声源定位方法和装置,及计算机存储介质
CN112466325B (zh) * 2020-11-25 2024-06-04 Oppo广东移动通信有限公司 声源定位方法和装置,及计算机存储介质
CN112925235A (zh) * 2021-01-21 2021-06-08 深圳市普渡科技有限公司 交互时的声源定位方法、设备和计算机可读存储介质
CN112799019A (zh) * 2021-01-26 2021-05-14 安徽淘云科技股份有限公司 声源定位方法、装置、电子设备及存储介质
CN112799019B (zh) * 2021-01-26 2023-07-07 安徽淘云科技股份有限公司 声源定位方法、装置、电子设备及存储介质
CN114359390A (zh) * 2022-01-10 2022-04-15 中国计量科学研究院 一种基于图像的鸣笛检测***声源定位偏差估计方法

Also Published As

Publication number Publication date
CN110082726B (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
CN110082726A (zh) 声源定位方法及装置、定位设备及存储介质
CN110047487B (zh) 车载语音设备的唤醒方法、装置、车辆以及机器可读介质
CN104816694B (zh) 一种驾车状态智能调整装置和方法
CN105957527A (zh) 一种语音控制电器的方法、装置及语音控制空调
CN110148405B (zh) 语音指令处理方法及装置、电子设备及存储介质
EP3754650B1 (en) Location-based voice recognition system through voice command
US20200209950A1 (en) Device-facing human-computer interaction method and system
CN106663422A (zh) 利用单一声学模型和自动口音检测实现的基于文本规则的多口音言语识别
CN107767863A (zh) 语音唤醒方法、***及智能终端
US20100087987A1 (en) Apparatus and Method for Vehicle Driver Recognition and Customization Using Onboard Vehicle System Settings
CN107316643A (zh) 语音交互方法及装置
CN109493871A (zh) 车载***的多屏语音交互方法及装置、存储介质和车机
CN106335432A (zh) 具有行车辅助***的智能后视镜、控制***及处理方法
CN106847283A (zh) 智能家电控制方法和装置
CN106251874A (zh) 一种语音门禁和安静环境监控方法及***
CN105835804A (zh) 用于监测车辆后部乘客就坐区域的方法和设备
CN109686368A (zh) 语音唤醒应答处理方法及装置、电子设备及存储介质
CN109830235A (zh) 语音控制方法、装置、车载控制设备和车辆
KR20160027728A (ko) 사용자 맞춤형 서비스를 위한 차량 기기 제어 장치 및 방법
CN109545207A (zh) 一种语音唤醒方法及装置
CN110349579A (zh) 语音唤醒处理方法及装置、电子设备及存储介质
CN108731183A (zh) 一种智能空调***及空调
CN108375179A (zh) 电梯用空调控制装置以及电梯空调控制***
CN109812925A (zh) 一种空调的控制方法、装置、存储介质及空调
CN108382155A (zh) 一种带提醒功能的空调语音控制装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant