CN111341313A - 一种车载多音区声源检测方法、装置及*** - Google Patents

一种车载多音区声源检测方法、装置及*** Download PDF

Info

Publication number
CN111341313A
CN111341313A CN202010143903.0A CN202010143903A CN111341313A CN 111341313 A CN111341313 A CN 111341313A CN 202010143903 A CN202010143903 A CN 202010143903A CN 111341313 A CN111341313 A CN 111341313A
Authority
CN
China
Prior art keywords
audio information
microphone
vehicle
sound
pillar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010143903.0A
Other languages
English (en)
Inventor
冯大航
陈孝良
常乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SoundAI Technology Co Ltd
Original Assignee
Beijing SoundAI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing SoundAI Technology Co Ltd filed Critical Beijing SoundAI Technology Co Ltd
Priority to CN202010143903.0A priority Critical patent/CN111341313A/zh
Publication of CN111341313A publication Critical patent/CN111341313A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H17/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本发明提供一种车载多音区声源检测方法、装置及***,获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。

Description

一种车载多音区声源检测方法、装置及***
技术领域
本发明属于语音识别技术领域,具体为涉及一种车载多音区声源检测方法、装置及***。
背景技术
随着科学技术的进步,人工智能的不断发展,不仅仅限于人与人之间的交互,随着语音交互技术越来越成熟,更多的是人和智能设备的交互,目前,该语音交互技术已经运用到更多的领域当中。例如:语音交互技术运用在汽车领域,在汽车领域运用语音交互技术具体为,将两个麦克风放在汽车的控制台,通过针对驾驶员的方向进行降噪处理,使得驾驶员的语音交互成功率提高。
虽然汽车中的其他位置的成员可使用两个麦克风进行交互,但是无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令。
发明内容
有鉴于此,本发明的目的在于提供一种车载多音区声源检测方法、装置及***,用于实现对车内不同位置的人进行区分,从而达到更好的交互体验的目的。技术方案如下:
本发明第一方面提供了一种车载多音区声源检测方法,应用于包括多个收音设备的车载***,每一个所述收音设备在一个方向上形成一个波束,每一个所述波束对应一个音区,所述方法包括:
获取每个收音设备收录的音频信息,得到多路音频信息;
计算并比较多路所述音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息;
确定所述最大的唤醒分值对应的音频信息所处音区,基于所述音区确定声源位置。
优选的,所述计算并比较多路所述音频信息的唤醒分值,确定最大的唤醒分值对应的音频信息,包括:
计算多路所述音频信息的信噪比;
比较多路所述音频信息的信噪比,确定信噪比最高的音频信息的唤醒分值最大,获取所述最大唤醒分值对应的音频信息。
优选的,若所述车载***的多个收音设备包括4个麦克风,所述4个麦克风集成为一个麦克风阵列,设置于汽车顶部,4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上分别形成一个波束,所述获取每个收音设备收录的音频信息,得到多路音频信息,包括:
获取4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上收录的音频信息,得到4路音频信息。
优选的,若所述车载***的多个收音设备包括设置于汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排B柱的第三麦克风和第四麦克风,所述第一麦克风在汽车驾驶员方向形成一个波束,所述第二麦克风在副驾驶方向形成一个波束,所述第三麦克风在后排左侧方向形成一个波束,所述第四麦克风在后排右侧方向形成一个波束,所述获取每个收音设备收录的音频信息,得到多路音频信息,包括:
分别获取所述第一麦克风在汽车驾驶员方向收录的音频信息,所述第二麦克风在副驾驶方向收录的音频信息,所述第三麦克风在后排左侧方向收录的音频信息,所述第四麦克风在后排右侧方向收录的音频信息,得到4路音频信息。
优选的,若所述车载***的多个收音设备包括设置于汽车左侧A柱上的第一麦克风、设置于汽车右侧A柱上的第二麦克风、设置于汽车左侧B柱上的第三麦克风和设置于汽车右侧B柱上的第四麦克风,所述第一麦克风在汽车左侧A柱方向形成一个波束,所述第二麦克风在汽车右侧A柱方向形成一个波束,所述第三麦克风在汽车左侧B柱方向形成一个波束,所述第四麦克风在汽车右侧B柱方向形成一个波束,所述获取每个收音设备收录的音频信息,得到多路音频信息,包括:
分别获取所述第一麦克风在汽车左侧A柱方向收录的音频信息,所述第二麦克风在汽车右侧A柱方向收录的音频信息,所述第三麦克风在汽车左侧B柱方向收录的音频信息,所述第四麦克风在汽车右侧B柱方向收录的音频信息,得到4路音频信息。
本发明第二方面提供了一种车载多音区声源检测装置,应用于包括多个收音设备的车载***,每一个所述收音设备在一个方向上形成一个波束,每一个所述波束对应一个音区,所述车载多音区声源检测装置包括:
获取模块,用于获取每个收音设备收录的音频信息,得到多路音频信息,并将所述多路音频信息输入至唤醒模块;
所述唤醒模块,用于计算并比较多路所述音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息;
确定模块,用于确定所述最大的唤醒分值对应的音频信息所处音区,基于所述音区确定声源位置。
优选的,所述唤醒模块,具体用于计算多路所述音频信息的信噪比,比较多路所述音频信息的信噪比,确定信噪比最高的音频信息的唤醒分值最大,获取所述最大唤醒分值对应的音频信息。
本发明第三方面提供了一种车载***,所述***包括第二方面提供的一种车载多音区声源检测装置的任意一项装置,以及多个收音设备;
每一个所述收音设备在一个方向上至少形成一个波束,每一个所述波束对应一个音区,每个所述收音设备,用于收录对应音区的音频信息,并将收录的音频信息发送至所述车载多音区声源检测装置;
所述车载多音区声源检测装置,用于获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路所述音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定所述最大的唤醒分值对应的音频信息所处音区,基于所述音区确定声源位置。
优选的,所述多个收音设备包括4个麦克风,所述4个麦克风集成为一个麦克风阵列,设置于汽车顶部,4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上分别形成一个波束;
或者
多个收音设备包括设置于汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排B柱的第三麦克风和第四麦克风,其中,所述第一麦克风在汽车驾驶员方向形成一个波束,所述第二麦克风在副驾驶方向形成一个波束,所述第三麦克风在后排左侧方向形成一个波束,所述第四麦克风在后排右侧方向形成一个波束。
优选的,所述多个收音设备包括设置于汽车左侧A柱上的第一麦克风、设置于汽车右侧A柱上的第二麦克风、设置于汽车左侧B柱上的第三麦克风和设置于汽车右侧B柱上的第四麦克风,其中,所述第一麦克风在汽车左侧A柱方向形成一个波束,所述第二麦克风在汽车右侧A柱方向形成一个波束,所述第三麦克风在汽车左侧B柱方向形成一个波束,所述第四麦克风在汽车右侧B柱方向形成一个波束。
与现有技术相比,本发明提供的上述技术方案具有如下优点:
获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种车载多音区声源检测方法的流程图;
图2是本发明实施例提供的一种以4个麦克风集成为一个麦克风阵列,设置于汽车顶部,对图1进行举例说明的流程图;
图3是本发明实施例提供的一种汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排B柱的第三麦克风和第四麦克风集成为一个麦克风阵列,对图1进行举例说明的流程图;
图4是本发明实施例提供的一种设置于汽车左侧A柱上的第一麦克风、设置于汽车右侧A柱上的第二麦克风、设置于汽车左侧B柱上的第三麦克风和设置于汽车右侧B柱上的第四麦克风,对图1进行举例说明的流程图;
图5是本发明实施例提供的一种车载多音区声源检测装置的结构示意图;
图6是本发明实施例提供的一种车载多音区声源检测***的结构示意图。
具体实施方式
本发明提供了一种车载多音区声源检测方法、装置及***,用于解决车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由背景技术可知,在现有技术中,汽车中的其他位置的成员可使用两个麦克风进行交互,但是无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令。
因此,本发明提供一种车载多音区声源检测方法、装置及***,用于实现对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。
如图1所示,示出了本发明实施例提供的一种车载多音区声源检测方法,该方法包括以下步骤:
S101:获取每个收音设备收录的音频信息,得到多路音频信息。
在具体实现S101的过程中,存在多个收音设备,每个收音设备在一个方向上形成一个波束,每一个波束对应一个音区,负责收录音区对应位置的音频信息。然后通过获取每个收音设备收录的音频信息,为计算并比较多路音频信息的唤醒分值提供基础。
S102:计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息。
在具体实现S102的过程中,在获得各路音频信息后,通过对音频信息进行计算,获得每一音频信息对应的唤醒分值,然后比较每一音频信息对应的唤醒分值的大小,确定声源位置。
具体的,通过计算多路音频信息的信噪比,比较多路音频信息的信噪比大小,确定信噪比最高的音频信息的唤醒分值最大,获取最大唤醒分值对应的音频信息。
其中,由于每一路音频信息的信噪比不同,所以每一音频信息的唤醒分值不同,信噪比越高唤醒分值就越大。信噪比最高,说明唤醒分值最大的音频信息所对应的收音设备距离车内发出音频的用户最近。
S103:确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。
在具体实现S103的过程中,通过比较多路音频信息的信噪高低,确定唤醒分值最大的一路音频信息,因为每一个收音设备在一个方向上形成一个波束,每一个波束对应一个音区,所以收录唤醒分值最大的一路音频信息的收音设备对应的音区,就为最大的唤醒分值对应的音频信息所处音区,最终根据该音区确定声源位置。
例如:存在甲、乙、丙和丁4路音频信息,其中甲音频信息的信噪比为20db,乙音频信息的信噪比为10db,丙音频信息的信噪比为20db,丁音频信息的信噪比为90db,其中丁音频信息的信噪比最高,因此确定唤醒分值最大的为丁音频信息,根据最大的唤醒分值对应的丁音频信息所处音区,最终根据该音区确定声源位置。
根据上述本发明实施例公开的车载多音区声源检测方法可知,获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。
基于上述本发明实施例图1示出的方法,这里以4个收音设备为4个麦克风,以及4个麦克风集成为一个麦克风阵列,设置于汽车顶部进行举例说明,如图2所示。
S201:获取4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上收录的音频信息,得到4路音频信息。
在具体实现S201的过程中,若车载***的多个收音设备包括4个麦克风,4个麦克风集成为一个麦克风阵列,设置于汽车顶部,4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上分别形成一个波束,则获取4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上收录的音频信息,得到4路音频信息。
需要说明的是,根据不同车型以及车位的不同麦克风阵列中的麦克风的个数不同,即麦克风的个数和车位相匹配。具体的,根据实际情况进行设定。
例如:轿车为5座时,麦克风阵列需要5个麦克风组成,对7座大型SUV(sportutility vehicle,运动型实用轿车)来说,则需要7个麦克风组成的麦克风阵列设置于汽车顶部。
S202:计算并比较4路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息。
在具体实现S202的过程中,可参见S102的实施例,这里不再进行赘述。
S203:确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。
根据上述本发明实施例公开的一种车载多音区声源检测方法可知,获取4个麦克风收录的音频信息,得到4路音频信息,计算并比较4路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。
可选的,基于上述本发明实施例图1示出的方法,这里以4个收音设备为4个麦克风,其中,汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排B柱的第三麦克风和第四麦克风集成为一个麦克风阵列,进行举例说明,如图3所示。
S301:分别获取第一麦克风在汽车驾驶员方向收录的音频信息,第二麦克风在副驾驶方向收录的音频信息,第三麦克风在后排左侧方向收录的音频信息,第四麦克风在后排右侧方向收录的音频信息,得到4路音频信息。
在具体实现S301的过程中,若车载***的多个收音设备包括设置于汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排B柱的第三麦克风和第四麦克风,第一麦克风在汽车驾驶员方向形成一个波束,第二麦克风在副驾驶方向形成一个波束,第三麦克风在后排左侧方向形成一个波束,第四麦克风在后排右侧方向形成一个波束,则分别获取第一麦克风在汽车驾驶员方向收录的音频信息,第二麦克风在副驾驶方向收录的音频信息,第三麦克风在后排左侧方向收录的音频信息,第四麦克风在后排右侧方向收录的音频信息,得到4路音频信息。
需要说明的是,汽车B柱位于汽车前门和后门交接处(后门铰链铰接处),除了B柱,汽车还包括A柱和C柱。其中,A柱位于汽车前挡风玻璃和前门的交接处(前门铰链铰接处),C柱位于汽车后门和后挡风玻璃的交接处(后门和后备箱处)。汽车A柱、B柱和C柱分别位于汽车不同的位置,作用在于:在轿车车身构造中,ABC柱的位置涉及到车辆的整体布置、安全及驾乘舒适性问题,它们不仅仅是撑起驾驶舱车顶的金属柱子,而且对驾驶舱内的成员有重要的保护作用,可以说是驾驶员的保护神。
在车辆发生翻滚或倾覆的时候,ABC柱能够有效避免驾驶舱被挤压变形,所以,ABC柱的强度对车内的生命来说有重要意义。
另一个方面,ABC柱也是一些装置的“必经之路”比如部分电器线路、安全带(B柱)、照明音响装置,甚至安全气囊都可以安置在上面。
需要说明的是,根据不同车型除了大部分汽车包括ABC柱,部分汽车还包括D柱。
当汽车内的用户不论从哪个位置发出音频,控制台安置的两个麦克风,以及汽车左右两边的B柱安置的麦克风,都能同时收录用户发出的音频信息。不同位置的麦克风对不同位置的人进行区分,从而达到更好的交互体验的目的。
S302:计算并比较4路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息。
S303:确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。
根据上述本发明实施例公开的一种车载多音区声源检测方法可知,获取4个麦克风收录的音频信息,得到4路音频信息,计算并比较4路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。
可选的,基于上述本发明实施例图1示出的方法,这里以4个收音设备为4个麦克风,其中,包括设置于汽车左侧A柱上的第一麦克风、设置于汽车右侧A柱上的第二麦克风、设置于汽车左侧B柱上的第三麦克风和设置于汽车右侧B柱上的第四麦克风,进行举例说明,如图4所示。
S401:分别获取第一麦克风在汽车左侧A柱方向收录的音频信息,第二麦克风在汽车右侧A柱方向收录的音频信息,第三麦克风在汽车左侧B柱方向收录的音频信息,第四麦克风在汽车右侧B柱方向收录的音频信息,得到4路音频信息。
在具体实现S401的过程中,若车载***的多个收音设备包括设置于汽车左侧A柱上的第一麦克风、设置于汽车右侧A柱上的第二麦克风、设置于汽车左侧B柱上的第三麦克风和设置于汽车右侧B柱上的第四麦克风,第一麦克风在汽车左侧A柱方向形成一个波束,第二麦克风在汽车右侧A柱方向形成一个波束,第三麦克风在汽车左侧B柱方向形成一个波束,第四麦克风在汽车右侧B柱方向形成一个波束,则分别获取第一麦克风在汽车左侧A柱方向收录的音频信息,第二麦克风在汽车右侧A柱方向收录的音频信息,第三麦克风在汽车左侧B柱方向收录的音频信息,第四麦克风在汽车右侧B柱方向收录的音频信息,得到4路音频信息。
S402:计算并比较4路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息。
S403:确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。
根据上述本发明实施例公开的车载多音区声源检测方法可知,获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。
基于上述本发明实施例图1公开的车载多音区声源检测方法,本发明实施例还对应公开一种车载多音区声源检测装置50,如图5所示,为本发明实施例公开的一种车载多音区声源检测装置50的结构示意图,包括:获取模块51、唤醒模块52和确定模块53。
获取模块51,用于获取每个收音设备收录的音频信息,得到多路音频信息,并将多路音频信息输入至唤醒模块。
唤醒模块52,用于计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息。
唤醒模块52具体用于计算多路音频信息的信噪比,比较多路音频信息的信噪比,确定信噪比最高的音频信息的唤醒分值最大,获取最大唤醒分值对应的音频信息。
确定模块53,用于确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。
根据上述本发明实施例公开的车载多音区声源检测装置可知,获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。
基于上述本发明实施例图1公开的车载多音区声源检测方法,本发明实施例还对应公开一种车载多音区声源检测***60,如图6所示,为本发明实施例提供的一种车载多音区声源检测***60的结构示意图,包括:车载多音区声源检测装置50,以及多个收音设备61。需要说明的是,每一个收音设备61在一个方向上至少形成一个波束,每一个波束对应一个音区。
每个收音设备61,用于收录对应音区的音频信息,并将收录的音频信息发送至车载多音区声源检测装置50。
车载多音区声源检测装置50,用于获取每个收音设备61收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。
可选的,多个收音设备61包括4个麦克风,4个麦克风集成为一个麦克风阵列,设置于汽车顶部,4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上分别形成一个波束。
可选的,多个收音设备61包括设置于汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排B柱的第三麦克风和第四麦克风,其中,第一麦克风在汽车驾驶员方向形成一个波束,第二麦克风在副驾驶方向形成一个波束,第三麦克风在后排左侧方向形成一个波束,第四麦克风在后排右侧方向形成一个波束。
可选的,多个收音设备61包括设置于汽车左侧A柱上的第一麦克风、设置于汽车右侧A柱上的第二麦克风、设置于汽车左侧B柱上的第三麦克风和设置于汽车右侧B柱上的第四麦克风,其中,第一麦克风在汽车左侧A柱方向形成一个波束,第二麦克风在汽车右侧A柱方向形成一个波束,第三麦克风在汽车左侧B柱方向形成一个波束,第四麦克风在汽车右侧B柱方向形成一个波束。
根据上述本发明实施例公开的车载多音区声源检测***可知,获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定最大的唤醒分值对应的音频信息所处音区,基于音区确定声源位置。实现了对车内不同位置的人进行区分,从而达到更好的交互体验的目的,解决了车内无法区分出是驾驶员下发的指令还是其他位置的成员下发的指令的问题。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种车载多音区声源检测方法,其特征在于,应用于包括多个收音设备的车载***,每一个所述收音设备在一个方向上形成一个波束,每一个所述波束对应一个音区,所述方法包括:
获取每个收音设备收录的音频信息,得到多路音频信息;
计算并比较多路所述音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息;
确定所述最大的唤醒分值对应的音频信息所处音区,基于所述音区确定声源位置。
2.根据权利要求1所述的方法,其特征在于,所述计算并比较多路所述音频信息的唤醒分值,确定最大的唤醒分值对应的音频信息,包括:
计算多路所述音频信息的信噪比;
比较多路所述音频信息的信噪比,确定信噪比最高的音频信息的唤醒分值最大,获取所述最大唤醒分值对应的音频信息。
3.根据权利要求1或2所述的方法,其特征在于,若所述车载***的多个收音设备包括4个麦克风,所述4个麦克风集成为一个麦克风阵列,设置于汽车顶部,4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上分别形成一个波束,所述获取每个收音设备收录的音频信息,得到多路音频信息,包括:
获取4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上收录的音频信息,得到4路音频信息。
4.根据权利要求1或2所述的方法,其特征在于,若所述车载***的多个收音设备包括设置于汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排B柱的第三麦克风和第四麦克风,所述第一麦克风在汽车驾驶员方向形成一个波束,所述第二麦克风在副驾驶方向形成一个波束,所述第三麦克风在后排左侧方向形成一个波束,所述第四麦克风在后排右侧方向形成一个波束,所述获取每个收音设备收录的音频信息,得到多路音频信息,包括:
分别获取所述第一麦克风在汽车驾驶员方向收录的音频信息,所述第二麦克风在副驾驶方向收录的音频信息,所述第三麦克风在后排左侧方向收录的音频信息,所述第四麦克风在后排右侧方向收录的音频信息,得到4路音频信息。
5.根据权利要求1或2所述的方法,其特征在于,若所述车载***的多个收音设备包括设置于汽车左侧A柱上的第一麦克风、设置于汽车右侧A柱上的第二麦克风、设置于汽车左侧B柱上的第三麦克风和设置于汽车右侧B柱上的第四麦克风,所述第一麦克风在汽车左侧A柱方向形成一个波束,所述第二麦克风在汽车右侧A柱方向形成一个波束,所述第三麦克风在汽车左侧B柱方向形成一个波束,所述第四麦克风在汽车右侧B柱方向形成一个波束,所述获取每个收音设备收录的音频信息,得到多路音频信息,包括:
分别获取所述第一麦克风在汽车左侧A柱方向收录的音频信息,所述第二麦克风在汽车右侧A柱方向收录的音频信息,所述第三麦克风在汽车左侧B柱方向收录的音频信息,所述第四麦克风在汽车右侧B柱方向收录的音频信息,得到4路音频信息。
6.一种车载多音区声源检测装置,其特征在于,应用于包括多个收音设备的车载***,每一个所述收音设备在一个方向上形成一个波束,每一个所述波束对应一个音区,所述车载多音区声源检测装置包括:
获取模块,用于获取每个收音设备收录的音频信息,得到多路音频信息,并将所述多路音频信息输入至唤醒模块;
所述唤醒模块,用于计算并比较多路所述音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息;
确定模块,用于确定所述最大的唤醒分值对应的音频信息所处音区,基于所述音区确定声源位置。
7.根据权利要求6所述的装置,其特征在于,所述唤醒模块,具体用于计算多路所述音频信息的信噪比,比较多路所述音频信息的信噪比,确定信噪比最高的音频信息的唤醒分值最大,获取所述最大唤醒分值对应的音频信息。
8.一种车载***,其特征在于,包括权利要求6或7所述的车载多音区声源检测装置,以及多个收音设备;
每一个所述收音设备在一个方向上至少形成一个波束,每一个所述波束对应一个音区,每个所述收音设备,用于收录对应音区的音频信息,并将收录的音频信息发送至所述车载多音区声源检测装置;
所述车载多音区声源检测装置,用于获取每个收音设备收录的音频信息,得到多路音频信息,计算并比较多路所述音频信息的唤醒分值,获取最大的唤醒分值对应的音频信息,确定所述最大的唤醒分值对应的音频信息所处音区,基于所述音区确定声源位置。
9.根据权利要求8所述的车载***,其特征在于,所述多个收音设备包括4个麦克风,所述4个麦克风集成为一个麦克风阵列,设置于汽车顶部,4个麦克风分别在汽车驾驶员方向、副驾驶方向、后排左侧方向和后排右侧方向四个方向上分别形成一个波束;
或者
多个收音设备包括设置于汽车控制台上由第一麦克风和第二麦克风构成的麦克风阵列和设置于汽车后排B柱的第三麦克风和第四麦克风,其中,所述第一麦克风在汽车驾驶员方向形成一个波束,所述第二麦克风在副驾驶方向形成一个波束,所述第三麦克风在后排左侧方向形成一个波束,所述第四麦克风在后排右侧方向形成一个波束。
10.根据权利要求8所述的车载***,其特征在于,所述多个收音设备包括设置于汽车左侧A柱上的第一麦克风、设置于汽车右侧A柱上的第二麦克风、设置于汽车左侧B柱上的第三麦克风和设置于汽车右侧B柱上的第四麦克风,其中,所述第一麦克风在汽车左侧A柱方向形成一个波束,所述第二麦克风在汽车右侧A柱方向形成一个波束,所述第三麦克风在汽车左侧B柱方向形成一个波束,所述第四麦克风在汽车右侧B柱方向形成一个波束。
CN202010143903.0A 2020-03-04 2020-03-04 一种车载多音区声源检测方法、装置及*** Pending CN111341313A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010143903.0A CN111341313A (zh) 2020-03-04 2020-03-04 一种车载多音区声源检测方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010143903.0A CN111341313A (zh) 2020-03-04 2020-03-04 一种车载多音区声源检测方法、装置及***

Publications (1)

Publication Number Publication Date
CN111341313A true CN111341313A (zh) 2020-06-26

Family

ID=71187171

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010143903.0A Pending CN111341313A (zh) 2020-03-04 2020-03-04 一种车载多音区声源检测方法、装置及***

Country Status (1)

Country Link
CN (1) CN111341313A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833899A (zh) * 2020-07-27 2020-10-27 腾讯科技(深圳)有限公司 一种基于多音区的语音检测方法、相关装置及存储介质
CN111986652A (zh) * 2020-07-31 2020-11-24 广州市凯泽利科技有限公司 一种车载智能语音***测试与评价方法
US20220194389A1 (en) * 2020-12-23 2022-06-23 Hyundai Motor Company Sound control apparatus for vehicles and method of controlling the same
US12051441B2 (en) 2020-07-27 2024-07-30 Tencent Technology (Shenzhen) Company Limited Multi-register-based speech detection method and related apparatus, and storage medium

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007125449A1 (en) * 2006-04-28 2007-11-08 Koninklijke Philips Electronics N.V. Device for and method of estimating directivity of a microphone arrangement
US20120197637A1 (en) * 2006-09-21 2012-08-02 Gm Global Technology Operations, Llc Speech processing responsive to a determined active communication zone in a vehicle
CN108399916A (zh) * 2018-01-08 2018-08-14 蔚来汽车有限公司 车载智能语音交互***和方法、处理装置和存储装置
CN109949810A (zh) * 2019-03-28 2019-06-28 华为技术有限公司 一种语音唤醒方法、装置、设备及介质
CN110476208A (zh) * 2017-02-13 2019-11-19 伯斯有限公司 用于扰动信号补偿的音频***和方法
CN110556103A (zh) * 2018-05-31 2019-12-10 阿里巴巴集团控股有限公司 音频信号处理方法、装置、***、设备和存储介质
CN110673096A (zh) * 2019-09-30 2020-01-10 北京地平线机器人技术研发有限公司 语音定位方法和装置、计算机可读存储介质、电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007125449A1 (en) * 2006-04-28 2007-11-08 Koninklijke Philips Electronics N.V. Device for and method of estimating directivity of a microphone arrangement
US20120197637A1 (en) * 2006-09-21 2012-08-02 Gm Global Technology Operations, Llc Speech processing responsive to a determined active communication zone in a vehicle
CN110476208A (zh) * 2017-02-13 2019-11-19 伯斯有限公司 用于扰动信号补偿的音频***和方法
CN108399916A (zh) * 2018-01-08 2018-08-14 蔚来汽车有限公司 车载智能语音交互***和方法、处理装置和存储装置
CN110556103A (zh) * 2018-05-31 2019-12-10 阿里巴巴集团控股有限公司 音频信号处理方法、装置、***、设备和存储介质
CN109949810A (zh) * 2019-03-28 2019-06-28 华为技术有限公司 一种语音唤醒方法、装置、设备及介质
CN110673096A (zh) * 2019-09-30 2020-01-10 北京地平线机器人技术研发有限公司 语音定位方法和装置、计算机可读存储介质、电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833899A (zh) * 2020-07-27 2020-10-27 腾讯科技(深圳)有限公司 一种基于多音区的语音检测方法、相关装置及存储介质
CN111833899B (zh) * 2020-07-27 2022-07-26 腾讯科技(深圳)有限公司 一种基于多音区的语音检测方法、相关装置及存储介质
US12051441B2 (en) 2020-07-27 2024-07-30 Tencent Technology (Shenzhen) Company Limited Multi-register-based speech detection method and related apparatus, and storage medium
CN111986652A (zh) * 2020-07-31 2020-11-24 广州市凯泽利科技有限公司 一种车载智能语音***测试与评价方法
US20220194389A1 (en) * 2020-12-23 2022-06-23 Hyundai Motor Company Sound control apparatus for vehicles and method of controlling the same

Similar Documents

Publication Publication Date Title
CN111341313A (zh) 一种车载多音区声源检测方法、装置及***
CN107027170B (zh) 用于确定乘坐区域的***和方法
US9832586B2 (en) Vehicle and control method for the same
DE102016212647B4 (de) Verfahren zum Betreiben eines Sprachsteuerungssystems in einem Innenraum und Sprachsteuerungssystem
CN110691299B (zh) 音频处理***、方法、装置、设备及存储介质
DE102018127357A1 (de) Audiowarnungen für ferngesteuerte einparkhilfe-anbindung
US11643094B2 (en) Noise control apparatus, vehicle having the same and method for controlling the vehicle
US20160221581A1 (en) System and method for classifying a road surface
CN105513585B (zh) 一种汽车主动降噪方法及***
US9953641B2 (en) Speech collector in car cabin
DE19817780A1 (de) Verfahren und Vorrichtung zum Bestimmen einer Deformation eines Fahrzeugseitenteils
US10146317B2 (en) Vehicle accessory operation based on motion tracking
CN110648663A (zh) 车载音频管理方法、装置、设备、汽车及可读存储介质
WO2017056706A1 (ja) 車載音響装置
JP2017069806A (ja) スピーカアレイ装置
CN110737423A (zh) 分区域音频播报方法、装置、设备、存储介质及车辆
DE102018123359A1 (de) Beschleunigungsmesserbasierte aussengeräuschüberwachung während manövern bei niedriger geschwindigkeit
WO2017056707A1 (ja) 障害物報知装置及び障害物報知方法
WO2003016110A2 (de) Verfahren zur unterstützung eines bedieners eines gerätes beim auffinden eines bedienelements
WO2018116627A1 (ja) 乗員検出装置、乗員検出システム、乗員検出方法
KR101851144B1 (ko) 사운드 수신 장치, 그를 가지는 차량 및 그 제어 방법
KR20120099255A (ko) 오디오 장치를 구비한 압축 성형식 트림 패널
US9721449B2 (en) Vehicle keyfob locator system
CN111791705B (zh) 带有语音控制的电动滑动副仪表板***及其语音控制方法
DE102022100888A1 (de) Fahrzeug

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination