CN114430498A - 一种车机双区音频***及控制方法 - Google Patents

一种车机双区音频***及控制方法 Download PDF

Info

Publication number
CN114430498A
CN114430498A CN202111677785.2A CN202111677785A CN114430498A CN 114430498 A CN114430498 A CN 114430498A CN 202111677785 A CN202111677785 A CN 202111677785A CN 114430498 A CN114430498 A CN 114430498A
Authority
CN
China
Prior art keywords
audio
module
zone
mode
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111677785.2A
Other languages
English (en)
Other versions
CN114430498B (zh
Inventor
蒋才科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huizhou Huayang General Intelligence Vehicle System Development Co ltd
Original Assignee
Huizhou Huayang General Intelligence Vehicle System Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huizhou Huayang General Intelligence Vehicle System Development Co ltd filed Critical Huizhou Huayang General Intelligence Vehicle System Development Co ltd
Priority to CN202111677785.2A priority Critical patent/CN114430498B/zh
Publication of CN114430498A publication Critical patent/CN114430498A/zh
Application granted granted Critical
Publication of CN114430498B publication Critical patent/CN114430498B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • G10L15/25Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4396Processing of audio elementary streams by muting the audio signal
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供车机双区音频***及控制方法,通过判断音频播放请求的区域类型以及是否开启安静模式,从而决定扬声器的不同工作模式。本发明实现了智能驾驶舱在使用过程音频播放和谈话可以同时进行互不干扰,大大提升了驾驶舱的智能化程度。

Description

一种车机双区音频***及控制方法
技术领域
本发明涉及车载音频技术领域,尤其涉及一种车机双区音频***及控制方法。
背景技术
随着汽车电子技术的不断发展,智能驾驶舱正逐渐兴起。在智能驾驶舱中,每个座位均配置了多媒体显示屏供用户使用。各用户在音频的需求上的差异造成了多声音场景,例如,前区的用户A在听音乐,后区的用户B在看电影,用户C与用户D在聊天,如此等等。这样便存在声音混乱,导致声音相互干扰。
目前,对于多区音频播放的解决方法是为每个多媒体屏配备一个耳机,通过耳机进行隔离。这种方式虽然可以隔离声音之间的干扰,但是显得不够智能,而且在一定程度上也阻碍了人与人之间的交流。
发明内容
本发明提供一种车机双区音频***及控制方法,旨在解决现有技术中的缺陷,实现智能驾驶舱在使用过程音频播放和谈话可以同时进行互不干扰,大大提升了驾驶舱的智能化程度。
为达到上述目的,本发明所采取的技术方案为:
本发明一方面提供一种车机双区音频***,包括:
音频输出决策模块,以及与所述音频输出决策模块连接的前台音频请求模块、后台音频请求模块、交谈请求模块,还包括音频输出接口模块,以及与所述音频输出接口模块连接的前左扬声器组、前右扬声器组、后左扬声器组、后右扬声器组,所述扬声器组包括一全向扬声器和一定向扬声器;所述音频输出决策模块还与所述音频输出接口模块连接;
所述音频输出决策模块,用于输出控制音频输出接口模块中各音频输出通道状态的命令,包括与所述全向扬声器或定向扬声器连接或断开;
所述前台音频请求模块,用于发起前台音频播放请求;
所述后台音频请求模块,用于发起后台音频播放请求;
所述交谈请求模块,用于发起前后排交谈请求,并选择交谈对象;
所述音频输出接口模块,由电子开关、音量调节器组成,所述电子开关用于根据音频决策模块输出的控制命令,将音频输出通道与所述全向扬声器或定向扬声器连接或断开,所述音量调节器用于根据所述控制命令确定各个扬声器的音量。
进一步地,还包括:与所述音频输出决策模块连接的安静模式启动模块、人声检测模块、图像识别模块;
所述安静模式启动模块,用于启动安静模式;
所述人声检测模块,用于检测同一区域中是否存在谈话声;
所述图像识别模块,用于检测所述谈话声是否与唇部动作是否匹配。
进一步地,还包括:与所述音频输出决策模块连接的蓝牙***测模块、人耳检测模块;
所述蓝牙通话监测模块,用于监测是否有蓝牙电话音频请求播放;
所述人耳检测模块,用于确定驾驶员的耳部位置。
本发明另一方面提供一种车机双区音频***控制方法,包括:
步骤1、接收至少一个音频播放请求,判断所述音频播放请求是否为双区播放模式,是则进入步骤4,否则进入下一步;
步骤2、若所述播放模式为前区播放,则检测后区安静模式是否开启,是则进入步骤5,否则进入下一步;若所述播放模式为后区播放,则检测前区安静模式是否开启,是则进入步骤5,否则进入下一步;
步骤3、将所述音频***设置为默认的第一工作模式,所述第一工作模式为将前区或后区的音频输出通道连接到对应的全向扬声器;
步骤4、将所述音频***设置为第二工作模式,所述第二工作模式为将前区、后区的音频输出通道连接到对应的定向扬声器;
步骤5、将所述音频***设置为第三工作模式,所述第三工作模式为关闭安静模式所在区域的音频输出通道,将播放区域的音频输出通道连接到对应的定向扬声器。
进一步地,在所述步骤5之后还包括:
步骤6、当检测到交谈模式开启后或检测到存在同区交谈者时,检测所述音频***当前工作模式是否为第一工作模式,是则切换到第二工作模式,并根据所述交谈模式或所述同区交谈者所属区域控制对应区域扬声器的工作状态。
具体地,所述检测到存在同区交谈者包括:
步骤A1、检测是否有谈话声,是则进入下一步,否则循环执行本步骤;
步骤A2、判断所述谈话声是否符合同区特征,是则进入下一步,否则返回上一步;
步骤A3、同步检测对应区域交谈者的唇部动作是否匹配,是则判断存在同区交谈者,否则返回步骤A1。
具体地,所述检测是否有谈话声包括:
步骤A1-1、将训练音频分为若干帧,提取各帧的特征向量,使用MFCC将所述各帧区分为谈话声和非谈话声;
步骤A1-2、利用分类后的所述各帧对SVM进行训练,得到支持向量以及最优分类超平面;
步骤A1-3、拾取当前环境音频信号并分为预设数量的环境音频帧;
步骤A1-4、利用训练后的SVM对所述预设数量的环境音频进行分类,得到分类结果;
步骤A1-5、对所述分类结果使用预置滤波器进行低通滤波,判断滤波结果中是否存在+1,是则判定为有谈话声,否则判定为没有谈话声。
具体地,所述预置滤波器为:
Figure BDA0003452737510000041
具体地,所述根据所述交谈模式或所述同区交谈者所属区域控制对应区域扬声器的工作状态包括:
步骤B1、检测车内的噪声值;
步骤B2、计算所述噪声值与最低可闻音量叠加值;
步骤B3、判断所述叠加值是否大于预设阈值,是则进入下一步,否则将对应区域扬声器音量降低到最低可闻音量;
步骤B4、判断当前车速是否为预设的最低允许值,是则关闭对应区域扬声器,否则控制车辆降低车速,并返回步骤B1。
进一步地,在所述步骤6之后还包括:
步骤7、当检测到蓝牙通话时,检测所述音频***当前工作模式是否为第一工作模式,是则切换到第二工作模式;
步骤8、获取驾驶员耳部的位置;
步骤9、根据所述耳部位置控制对应区域定向扬声器的角度,使所述驾驶员耳部为接受面。
具体地,所述步骤8包括:
步骤801、获取驾驶员的头部图像,并对所述头部图像进行直方图均衡化处理;
步骤802、根据所述直方图的灰度阈值将所述头部图像进行二值化处理;
步骤803、从上往下逐行遍历所述图像的右上区域,若当前像素点的灰度值为255,则停止遍历,并将所述当前像素判定为耳廓的上部顶点;
步骤804、从右向左逐列遍历所述图像的右上区域,若当前像素点的灰度值为255,则停止遍历,并将所述当前像素判定为耳廓的右侧顶点;
步骤805、根据所述耳廓的上部顶点、耳廓的右侧顶点确定驾驶员耳部的位置。
本发明的有益效果在于:本发明通过通过判断音频播放请求的区域类型以及是否开启安静模式,从而决定扬声器的不同工作模式,实现了智能驾驶舱在使用过程音频播放和谈话可以同时进行互不干扰,大大提升了驾驶舱的智能化程度。
附图说明
图1是本发明的车机双区音频***的结构示意图;
图2是本发明的车机双区音频***装置的另一结构示意图;
图3是本发明的车机双区音频***装置的又一结构示意图;
图4是本发明的车机双区音频***控制方法的流程示意图。
具体实施方式
下面结合附图具体阐明本发明的实施方式,附图仅供参考和说明使用,不构成对本发明专利保护范围的限制。
实施例1
如图1所示,本实施例提供一种车机双区音频***,包括:
音频输出决策模块,以及与所述音频输出决策模块连接的前台音频请求模块、后台音频请求模块、交谈请求模块,还包括音频输出接口模块,以及与所述音频输出接口模块连接的前左扬声器组、前右扬声器组、后左扬声器组、后右扬声器组,所述扬声器组包括一全向扬声器和一定向扬声器;所述音频输出决策模块还与所述音频输出接口模块连接;
所述音频输出决策模块,用于输出控制音频输出接口模块中各音频输出通道状态的命令,包括与所述全向扬声器或定向扬声器连接或断开;
所述前台音频请求模块,用于发起前台音频播放请求;
所述后台音频请求模块,用于发起后台音频播放请求;
所述交谈请求模块,用于发起前后排交谈请求,并选择交谈对象;
所述音频输出接口模块,由电子开关、音量调节器组成,所述电子开关用于根据音频决策模块输出的控制命令,将音频输出通道与所述全向扬声器或定向扬声器连接或断开,所述音量调节器用于根据所述控制命令确定各个扬声器的音量。
在本实施例中,所述定向扬声器的角度可以调节。
实施例2
如图2所示,与实施例1不同的是,本实施例的车机双区音频***还包括:与所述音频输出决策模块连接的安静模式启动模块、人声检测模块、图像识别模块;
所述安静模式启动模块,用于启动安静模式;
所述人声检测模块,用于检测同一区域中是否存在谈话声;
所述图像识别模块,用于检测所述谈话声是否与唇部动作是否匹配。
实施例3
如图3所示,与实施例2不同的是,本实施例的车机双区音频***还包括:与所述音频输出决策模块连接的蓝牙***测模块、人耳检测模块;
所述蓝牙通话监测模块,用于监测是否有蓝牙电话音频请求播放;
所述人耳检测模块,用于确定驾驶员的耳部位置。
实施例4
如图4所示,本实施例提供一种车机双区音频***控制方法,包括:
步骤1、接收至少一个音频播放请求,判断所述音频播放请求是否为双区播放模式,是则进入步骤4,否则进入下一步。
步骤2、若所述播放模式为前区播放,则检测后区安静模式是否开启,是则进入步骤5,否则进入下一步;若所述播放模式为后区播放,则检测前区安静模式是否开启,是则进入步骤5,否则进入下一步。
在具体实施时,可以在前区、后区显示屏的人机交互界面上设置一个安静模式的图标,如果用户点击该图标则表示用户目前不想被干扰。
步骤3、将所述音频***设置为默认的第一工作模式,所述第一工作模式为将前区或后区的音频输出通道连接到对应的全向扬声器。
在本实施例中,在默认的第一工作模式下,仅有前区或后区一个区域播放音频。
在具体实施时,可以设置默认将前区的前左、前右、后左、后右四个音频输出通道分别连接到前左、前右、后左、后右扬声器组中的全向扬声器,从而在形成环绕声。
步骤4、将所述音频***设置为第二工作模式,所述第二工作模式为将前区、后区的音频输出通道连接到对应的定向扬声器。
在双区播放模式下,前区、后区的音频输出都是立体声模式,而不是环绕声模式。
步骤5、将所述音频***设置为第三工作模式,所述第三工作模式为关闭安静模式所在区域的音频输出通道,将播放区域的音频输出通道连接到对应的定向扬声器。
实施例5
与实施例4不同的是,在所述步骤5之后还包括:
步骤6、当检测到交谈模式开启后或检测到存在同区交谈者时,检测所述音频***当前工作模式是否为第一工作模式,是则切换到第二工作模式,并根据所述交谈模式或所述同区交谈者所属区域控制对应区域扬声器的工作状态。
在具体实施时,可以在前区、后区显示屏的人机交互界面上设置一个交谈模式的图标,在用户点击该图标后,继续让用户选择前左、前右或后左、后右区域中的具体交谈区域。例如,如果是前排用户点击该图标,则让其继续选择后左或者后右区域;如果是后排用户点击该图标,则让其选择前左(驾驶位)或者前后(副驾驶位)区域。
在本实施例中,所述检测到存在同区交谈者包括:
步骤A1、检测是否有谈话声,是则进入下一步,否则循环执行本步骤。
在具体实施时,通过麦克风来拾取声音,然后通过人声检测模块检测是否存在谈话声。
步骤A2、判断所述谈话声是否符合同区特征,是则进入下一步,否则返回上一步。
在具体实施时,可以通过定向麦克风获取说话者与麦克风的距离、方向,从而判断交谈者是否属于同一个区域(前区或者后区)。
步骤A3、同步检测对应区域交谈者的唇部动作是否匹配,是则判断存在同区交谈者,否则返回步骤A1。
在本实施例中,所述检测是否有谈话声包括:
步骤A1-1、将训练音频分为若干帧,提取各帧的特征向量,使用MFCC将所述各帧区分为谈话声和非谈话声。
MFCC是Mel-frequency cepstral coefficients的缩写,即梅尔频率倒谱系数,利用人耳听觉特性与Hz频率成非线性对应关系,计算得到的Hz频谱特征,主要用于语音数据特征提取。
步骤A1-2、利用分类后的所述各帧对SVM进行训练,得到支持向量以及最优分类超平面。
SVM是Support Vector Machine的缩写,即支持向量机,其基本模型是在特征空间上找到最佳的分离超平面使得训练集上正负样本间隔最大,用来解决二分类问题。
步骤A1-3、拾取当前环境音频信号并分为预设数量的环境音频帧。
步骤A1-4、利用训练后的SVM对所述预设数量的环境音频进行分类,得到分类结果。
在本实施例中,所述分类结果记为w(k)∈(-1,+1),k=1,2,…n,n表示预设数量。
步骤A1-5、对所述分类结果使用预置滤波器进行低通滤波,判断滤波结果中是否存在+1,是则判定为有谈话声,否则判定为没有谈话声。
在本实施例中,所述预置滤波器为:
Figure BDA0003452737510000081
m需要根据实际效果进行设定,在本实施例中,m=50。
在本实施例中,所述根据所述交谈模式或所述同区交谈者所属区域控制对应区域扬声器的工作状态包括:
步骤B1、检测车内的噪声值;
步骤B2、计算所述噪声值与最低可闻音量叠加值;
步骤B3、判断所述叠加值是否大于预设阈值,是则进入下一步,否则将对应区域扬声器音量降低到最低可闻音量;
步骤B4、判断当前车速是否为预设的最低允许值,是则关闭对应区域扬声器,否则控制车辆降低车速,并返回步骤B1。
实施例6
与实施例4不同的是,在所述步骤6之后还包括:
步骤7、当检测到蓝牙通话时,检测所述音频***当前工作模式是否为第一工作模式,是则切换到第二工作模式;
步骤8、获取驾驶员耳部的位置;
步骤9、根据所述耳部位置控制对应区域定向扬声器的角度,使所述驾驶员耳部为接受面。
在本实施例中,所述步骤8包括:
步骤801、获取驾驶员的头部图像,并对所述头部图像进行直方图均衡化处理;
步骤802、根据所述直方图的灰度阈值将所述头部图像进行二值化处理;
步骤803、从上往下逐行遍历所述图像的右上区域,若当前像素点的灰度值为255,则停止遍历,并将所述当前像素判定为耳廓的上部顶点;
步骤804、从右向左逐列遍历所述图像的右上区域,若当前像素点的灰度值为255,则停止遍历,并将所述当前像素判定为耳廓的右侧顶点;
步骤805、根据所述耳廓的上部顶点、耳廓的右侧顶点确定驾驶员耳部的位置。
以上所揭露的仅为本发明的较佳实施例,不能以此来限定本发明的权利保护范围,因此依本发明申请专利范围所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种车机双区音频***装置,其特征在于,包括:
音频输出决策模块,以及与所述音频输出决策模块连接的前台音频请求模块、后台音频请求模块、交谈请求模块,还包括音频输出接口模块,以及与所述音频输出接口模块连接的前左扬声器组、前右扬声器组、后左扬声器组、后右扬声器组,所述扬声器组包括一全向扬声器和一定向扬声器;所述音频输出决策模块还与所述音频输出接口模块连接;
所述音频输出决策模块,用于输出控制音频输出接口模块中各音频输出通道状态的命令,包括与所述全向扬声器或定向扬声器连接或断开;
所述前台音频请求模块,用于发起前台音频播放请求;
所述后台音频请求模块,用于发起后台音频播放请求;
所述交谈请求模块,用于发起前后排交谈请求,并选择交谈对象;
所述音频输出接口模块,由电子开关、音量调节器组成,所述电子开关用于根据音频决策模块输出的控制命令,将音频输出通道与所述全向扬声器或定向扬声器连接或断开,所述音量调节器用于根据所述控制命令确定各个扬声器的音量。
2.根据权利要求1所述的车机双区音频***装置,其特征在于,还包括:与所述音频输出决策模块连接的安静模式启动模块、人声检测模块、图像识别模块;
所述安静模式启动模块,用于启动安静模式;
所述人声检测模块,用于检测同一区域中是否存在谈话声;
所述图像识别模块,用于检测所述谈话声是否与唇部动作是否匹配。
3.根据权利要求2所述的车机双区音频***装置,其特征在于,与所述音频输出决策模块连接的蓝牙***测模块、人耳检测模块;
所述蓝牙通话监测模块,用于监测是否有蓝牙电话音频请求播放;
所述人耳检测模块,用于确定驾驶员的耳部位置。
4.一种车机双区音频***控制方法,其特征在于,包括:
步骤1、接收至少一个音频播放请求,判断所述音频播放请求是否为双区播放模式,是则进入步骤4,否则进入下一步;
步骤2、若所述播放模式为前区播放,则检测后区安静模式是否开启,是则进入步骤5,否则进入下一步;若所述播放模式为后区播放,则检测前区安静模式是否开启,是则进入步骤5,否则进入下一步;
步骤3、将所述音频***设置为默认的第一工作模式,所述第一工作模式为将前区或后区的音频输出通道连接到对应的全向扬声器;
步骤4、将所述音频***设置为第二工作模式,所述第二工作模式为将前区、后区的音频输出通道连接到对应的定向扬声器;
步骤5、将所述音频***设置为第三工作模式,所述第三工作模式为关闭安静模式所在区域的音频输出通道,将播放区域的音频输出通道连接到对应的定向扬声器。
5.根据权利要求4所述的车机双区音频***控制方法,其特征在于,在所述步骤5之后还包括:
步骤6、当检测到交谈模式开启后或检测到存在同区交谈者时,检测所述音频***当前工作模式是否为第一工作模式,是则切换到第二工作模式,并根据所述交谈模式或所述同区交谈者所属区域控制对应区域扬声器的工作状态。
6.根据权利要求5所述的车机双区音频***控制方法,其特征在于,所述检测到存在同区交谈者包括:
步骤A1、检测是否有谈话声,是则进入下一步,否则循环执行本步骤;
步骤A2、判断所述谈话声是否符合同区特征,是则进入下一步,否则返回上一步;
步骤A3、同步检测对应区域交谈者的唇部动作是否匹配,是则判断存在同区交谈者,否则返回步骤A1。
7.根据权利要求6所述的车机双区音频***控制方法,其特征在于,所述检测是否有谈话声包括:
步骤A1-1、将训练音频分为若干帧,提取各帧的特征向量,使用MFCC将所述各帧区分为谈话声和非谈话声;
步骤A1-2、利用分类后的所述各帧对SVM进行训练,得到支持向量以及最优分类超平面;
步骤A1-3、拾取当前环境音频信号并分为预设数量的环境音频帧;
步骤A1-4、利用训练后的SVM对所述预设数量的环境音频进行分类,得到分类结果;
步骤A1-5、对所述分类结果使用预置滤波器进行低通滤波,判断滤波结果中是否存在+1,是则判定为有谈话声,否则判定为没有谈话声。
8.根据权利要求5所述的车机双区音频***控制方法,其特征在于,所述根据所述交谈模式或所述同区交谈者所属区域控制对应区域扬声器的工作状态包括:
步骤B1、检测车内的噪声值;
步骤B2、计算所述噪声值与最低可闻音量叠加值;
步骤B3、判断所述叠加值是否大于预设阈值,是则进入下一步,否则将对应区域扬声器音量降低到最低可闻音量;
步骤B4、判断当前车速是否为预设的最低允许值,是则关闭对应区域扬声器,否则控制车辆降低车速,并返回步骤B1。
9.根据权利要求5所述的车机双区音频***控制方法,其特征在于,在所述步骤6之后还包括:
步骤7、当检测到蓝牙通话时,检测所述音频***当前工作模式是否为第一工作模式,是则切换到第二工作模式;
步骤8、获取驾驶员耳部的位置;
步骤9、根据所述耳部位置控制对应区域定向扬声器的角度,使所述驾驶员耳部为接受面。
10.根据权利要求9所述的车机双区音频***控制方法,其特征在于,所述步骤8包括:
步骤801、获取驾驶员的头部图像,并对所述头部图像进行直方图均衡化处理;
步骤802、根据所述直方图的灰度阈值将所述头部图像进行二值化处理;
步骤803、从上往下逐行遍历所述图像的右上区域,若当前像素点的灰度值为255,则停止遍历,并将所述当前像素判定为耳廓的上部顶点;
步骤804、从右向左逐列遍历所述图像的右上区域,若当前像素点的灰度值为255,则停止遍历,并将所述当前像素判定为耳廓的右侧顶点;
步骤805、根据所述耳廓的上部顶点、耳廓的右侧顶点确定驾驶员耳部的位置。
CN202111677785.2A 2021-12-31 2021-12-31 一种车机双区音频***及控制方法 Active CN114430498B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111677785.2A CN114430498B (zh) 2021-12-31 2021-12-31 一种车机双区音频***及控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111677785.2A CN114430498B (zh) 2021-12-31 2021-12-31 一种车机双区音频***及控制方法

Publications (2)

Publication Number Publication Date
CN114430498A true CN114430498A (zh) 2022-05-03
CN114430498B CN114430498B (zh) 2023-07-18

Family

ID=81310666

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111677785.2A Active CN114430498B (zh) 2021-12-31 2021-12-31 一种车机双区音频***及控制方法

Country Status (1)

Country Link
CN (1) CN114430498B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100310100A1 (en) * 2009-06-03 2010-12-09 International Truck Intellectual Property Company, Llc Loudspeaker input switch system to reorient sound in truck
US9429947B1 (en) * 2016-04-14 2016-08-30 Eric John Wengreen Self-driving vehicle systems and methods
GB201701137D0 (en) * 2016-01-25 2017-03-08 Ford Global Tech Llc System and method for personalized sound isolation in vehilce audio zones
GB201721747D0 (en) * 2016-12-27 2018-02-07 Harman Int Ind Control for vehicle sound output
US10150425B1 (en) * 2018-01-19 2018-12-11 Joseph Frank Scalisi Vehicle speaker systems and methods
US10160399B1 (en) * 2018-01-19 2018-12-25 Joseph Frank Scalisi Vehicle speaker systems and methods
CN110234048A (zh) * 2019-02-02 2019-09-13 上海蔚来汽车有限公司 车内声音分区控制装置和方法、控制器及介质
WO2020082772A1 (zh) * 2018-10-25 2020-04-30 广州小鹏汽车科技有限公司 车辆音响***及音频播放方法
US10728493B1 (en) * 2019-07-29 2020-07-28 Rovi Guides, Inc Method and apparatus for reducing interference from content play in multi-device environment
WO2020173156A1 (zh) * 2019-02-27 2020-09-03 北京地平线机器人技术研发有限公司 用于控制多个扬声器播放音频的方法、装置和电子设备
CN111698613A (zh) * 2020-06-18 2020-09-22 重庆清文科技有限公司 一种基于声场分割的车载声音控制方法
CN111816199A (zh) * 2020-07-11 2020-10-23 韶关市启之信息技术有限公司 一种汽车智能座舱的环境音控制方法与***
CN112312280A (zh) * 2019-07-31 2021-02-02 北京地平线机器人技术研发有限公司 一种车内声音播放方法及装置
US20210204059A1 (en) * 2019-12-30 2021-07-01 Harman International Industries, Incorporated Voice ducking with spatial speech separation for vehicle audio system
EP3869820A1 (en) * 2020-02-21 2021-08-25 Harman International Industries, Incorporated Dual-zone automotive multimedia system

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100310100A1 (en) * 2009-06-03 2010-12-09 International Truck Intellectual Property Company, Llc Loudspeaker input switch system to reorient sound in truck
GB201701137D0 (en) * 2016-01-25 2017-03-08 Ford Global Tech Llc System and method for personalized sound isolation in vehilce audio zones
US9429947B1 (en) * 2016-04-14 2016-08-30 Eric John Wengreen Self-driving vehicle systems and methods
GB201721747D0 (en) * 2016-12-27 2018-02-07 Harman Int Ind Control for vehicle sound output
US10150425B1 (en) * 2018-01-19 2018-12-11 Joseph Frank Scalisi Vehicle speaker systems and methods
US10160399B1 (en) * 2018-01-19 2018-12-25 Joseph Frank Scalisi Vehicle speaker systems and methods
WO2020082772A1 (zh) * 2018-10-25 2020-04-30 广州小鹏汽车科技有限公司 车辆音响***及音频播放方法
CN110234048A (zh) * 2019-02-02 2019-09-13 上海蔚来汽车有限公司 车内声音分区控制装置和方法、控制器及介质
WO2020173156A1 (zh) * 2019-02-27 2020-09-03 北京地平线机器人技术研发有限公司 用于控制多个扬声器播放音频的方法、装置和电子设备
US10728493B1 (en) * 2019-07-29 2020-07-28 Rovi Guides, Inc Method and apparatus for reducing interference from content play in multi-device environment
CN112312280A (zh) * 2019-07-31 2021-02-02 北京地平线机器人技术研发有限公司 一种车内声音播放方法及装置
US20210204059A1 (en) * 2019-12-30 2021-07-01 Harman International Industries, Incorporated Voice ducking with spatial speech separation for vehicle audio system
EP3869820A1 (en) * 2020-02-21 2021-08-25 Harman International Industries, Incorporated Dual-zone automotive multimedia system
CN111698613A (zh) * 2020-06-18 2020-09-22 重庆清文科技有限公司 一种基于声场分割的车载声音控制方法
CN111816199A (zh) * 2020-07-11 2020-10-23 韶关市启之信息技术有限公司 一种汽车智能座舱的环境音控制方法与***

Also Published As

Publication number Publication date
CN114430498B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
US9672805B2 (en) Feedback cancelation for enhanced conversational communications in shared acoustic space
US9293151B2 (en) Speech signal enhancement using visual information
CN108141663B (zh) 集音装置以及集音装置的控制方法
CN107004425B (zh) 共享声学空间中的增强型对话通信
CN112397084B (zh) 自适应调整多媒体音量方法、车载终端及计算机存储介质
US11089404B2 (en) Sound processing apparatus and sound processing method
US20160127827A1 (en) Systems and methods for selecting audio filtering schemes
WO2015086895A1 (en) Spatial audio processing apparatus
US20240096343A1 (en) Voice quality enhancement method and related device
CN108028982A (zh) 电子设备及其音频处理方法
CN103079145A (zh) 新型车载多媒体播放器及其实现方法
CN110636402A (zh) 具有本地通话情况确认模式的耳机装置
CN115482830B (zh) 语音增强方法及相关设备
WO2021263136A2 (en) Systems, apparatus, and methods for acoustic transparency
CN113544775A (zh) 用于头戴式音频设备的音频信号增强
US8331591B2 (en) Hearing aid and method for operating a hearing aid
WO2020120754A1 (en) Audio processing device, audio processing method and computer program thereof
US11678114B2 (en) Sound collection loudspeaker apparatus, method and program for the same
CN114125655A (zh) 一种扬声器控制方法、装置、电子设备及存储介质
JP3411648B2 (ja) 車載用オーディオ装置
CN112312280B (zh) 一种车内声音播放方法及装置
CN114430498B (zh) 一种车机双区音频***及控制方法
CN114537304A (zh) 一种整车声音智能调节方法及***
EP4007299A1 (en) Audio output using multiple different transducers
US20110206219A1 (en) Electronic device for receiving and transmitting audio signals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant