CN106448662B

CN106448662B - 利用汽车喇叭声纹中断车机消息播报的方法及***

Info

Publication number: CN106448662B
Application number: CN201610991111.2A
Authority: CN
Inventors: 邹兴旺; 陈吉胜
Original assignee: Unisound Shanghai Intelligent Technology Co Ltd
Current assignee: Unisound Shanghai Intelligent Technology Co Ltd
Priority date: 2016-11-01
Filing date: 2016-11-01
Publication date: 2020-10-13
Anticipated expiration: 2036-11-01
Also published as: CN106448662A

Abstract

本发明涉及一种利用汽车喇叭声纹中断车机消息播报的方法及***，该方法包括：于车机设备上建立喇叭声纹模型；在所述车机设备收到需进行消息播报的消息时，激活所述喇叭声纹模型；通过所述车机设备上的麦克风连续不断地进行监听录音以获取录音信号；对所述录音信号进行降噪处理并提取对应的声纹特征；以及将所提取的声纹特征输入到所述喇叭声纹模型中进行匹配判断，若所提取的声纹特征与喇叭声纹特征相匹配，则形成中断播报指令发送给所述车机设备以中断消息播报进而使得所述消息播报结束。本发明利用了喇叭声音来中断消息播报，对车主的隐私起到了很好的保护。按喇叭的操作经常发生且极易操作，能够快速有效的中断消息播报。

Description

利用汽车喇叭声纹中断车机消息播报的方法及***

技术领域

本发明涉及建筑施工领域，特指一种利用汽车喇叭声纹中断车机消息播报的方法及***。

背景技术

语音交互方式在车载设备的广泛运用，涉及到的技术包括：语音识别、语音合成、声纹识别等。用户通过语音交互***，说话就能操控汽车上车机设备，实现打电话、导航、听音乐等功能。同时，当设备收到消息时，如来电、来短信、微信消息、推送通知等，也会通过语音合成技术，提示用户接收到新信息，是否需要播报内容或执行操作。

在车机设备上的消息播报***进行消息播报时，当所播报的消息为私人信息，而车内同乘有多人时，为避免私人信息被直接播报出来，车主需通过操作中断消息播报***的播报，中断操作一般通过车机设备的控制面板来实施，可能会存在操作不及时而导致播报未及时终止的情形，即使及时终止了播报也会给车主带来尴尬的情境。

发明内容

本发明的目的在于克服现有技术的缺陷，提供一种利用汽车喇叭声纹中断车机消息播报的方法及***，解决现有技术中消息播报***在消息播报时通过操作控制面板终止播报而存在的操作不及时和为车主带来尴尬情境的问题。

实现上述目的的技术方案是：

本发明提供了一种利用汽车喇叭声纹中断车机消息播报的方法，包括如下步骤：

于车机设备上建立喇叭声纹模型；

在所述车机设备收到需进行消息播报的消息时，激活所述喇叭声纹模型；

通过所述车机设备上的麦克风连续不断地进行监听录音以获取录音信号；

对所述录音信号进行降噪处理并提取对应的声纹特征；以及

将所提取的声纹特征输入到所述喇叭声纹模型中进行匹配判断，

若所提取的声纹特征与喇叭声纹特征相匹配，则形成中断播报指令发送给所述车机设备以中断消息播报进而使得所述消息播报结束；

若所提取的声纹特征与所述喇叭声纹特征不匹配，则继续进行匹配判断直至所述消息播报结束。

本发明利用了喇叭声音来中断消息播报，在车机声波进行消息播报的过程中，始终对车内的环境进行监听，当监听到喇叭声音时，立即中断消息播报并取消播报流程，对车主的隐私起到了很好的保护。按喇叭的操作经常发生且极易操作，能够快速有效的中断消息播报，另外，利用喇叭中断播报，按喇叭能够转移其他同乘人员的注意力，且按喇叭的动作不会产生违和感，能够较好的化解尴尬情境，提升了语音产品的人文关怀。

本发明利用汽车喇叭声纹中断车机消息播报的方法的进一步改进在于，于车机设备上建立喇叭声纹模型，包括：

采集多种环境下的喇叭声音信号，并从所采集的喇叭声音信号中提取出对应的喇叭声纹特征；

利用所提取的喇叭声纹特征进行声学模型训练以得到对应的喇叭声纹模型。

本发明利用汽车喇叭声纹中断车机消息播报的方法的进一步改进在于，采集多种环境下的喇叭声音信号，包括：

采集汽车在不同档位行驶的环境下的喇叭声音信号；

采集汽车在开、关窗的环境下的喇叭声音信号；以及

采集汽车内有、无背景声音的环境下的喇叭声音信号。

本发明利用汽车喇叭声纹中断车机消息播报的方法的进一步改进在于，在消息播报结束时，释放所述喇叭声纹模型。

本发明还提供了一种利用汽车喇叭声纹中断车机消息播报的***，包括：

装设于车机设备上的喇叭声纹模型，所述喇叭声纹模型与所述车机设备上的消息播报***连接，所述消息播报***在收到需进行消息播报的消息时形成激活指令发送给所述喇叭声纹模型，以激活所述喇叭声纹模型；

与所述喇叭声纹模型连接的音频获取模块，所述音频获取模块与所述车机设备上的麦克风控制连接，所述喇叭声纹模型被激活后向所述音频获取模块发送录音获取指令，所述音频获取模块根据所述录音获取指令控制所述麦克风连续不断地进行监听录音并获取所形成录音信号，所述音频获取模块对所获取的所述录音信号进行降噪处理；

与所述音频获取模块和所述喇叭声纹模型连接的特征提取模块，所述特征提取模块接收所述音频获取模块所获取的录音信号并对所述录音信号进行特征提取以获得对应的声纹特征，所述特征提取模块将所提取的声纹特征发送给所述喇叭声纹模型；以及

与所述喇叭声纹模型和所述消息播报***连接中断控制模块；

其中：

所述喇叭声纹模型对所提取的声纹特征与喇叭声纹特征进行匹配判断并输出匹配判断结果给所述中断控制模块；

当所述匹配判断结果为所提取的声纹特征与喇叭声纹特征相匹配时，所述中断控制模块形成中断播报指令发送给所述消息播报***以中断消息播报进而使得消息播报结束；

当所述匹配判断结果为所提取的声纹特征与喇叭声纹特征不匹配时，则中断控制模块不处理。

本发明利用汽车喇叭声纹中断车机消息播报的***的进一步改进在于，所述喇叭声纹模型通过喇叭声纹特征进行声学模型训练得到，所述喇叭声纹特征通过对多种环境下的喇叭声音信号进行提取获得。

本发明利用汽车喇叭声纹中断车机消息播报的***的进一步改进在于，多种环境下的喇叭声音信号包括汽车在不同档位行驶的环境下的喇叭声音信号，汽车在开、关窗的环境下的喇叭声音信号以及汽车内有、无背景声音的环境下的喇叭声音信号。

本发明利用汽车喇叭声纹中断车机消息播报的***的进一步改进在于，所述消息播报***在消息播报结束时，形成结束播报指令发送给所述喇叭声纹模型以释放所述喇叭声纹模型。

本发明利用汽车喇叭声纹中断车机消息播报的***的进一步改进在于，所述喇叭声纹模型在接收到所述结束播报指令后形成关闭指令并发送至所述音频获取模块、所述特征提取模块以及所述中断控制模块，以令所述音频获取模块、所述特征提取模块以及所述中断控制模块停止运行。

附图说明

图1为本发明利用汽车喇叭声纹中断车机消息播报的方法及***的流程图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明。

本发明提供了一种利用汽车喇叭声纹中断车机消息播报的方法及***，为车机设备在消息播报过程提供了一种中断播报的方法，即利用喇叭声音来中断车机设备的消息播报流程。汽车喇叭声音是一种固定的声音信号，具有固定频谱和声域，通过采集、归纳、提取汽车喇叭声音的声纹特征，并利用该声纹特征训练得到喇叭声纹模型，进而结合声纹识别技术，在车机设备的消息播报流程中持续监听声音信号，当监听到声音信号匹配喇叭声纹模型中的已知的喇叭声纹特征，就判断为喇叭声音，并且执行中断消息播报流程的操作，当监听到的声音不匹配时，就继续监听直至消息播报流程结束。由于按喇叭操作经常发生且极易操作，能够快速有效的中断消息播报流程，按喇叭还能够转移车内其他乘坐人的注意力，且按喇叭动作不会产生违和感，化解尴尬情境，保护了用户的隐私信息不被播报，还提升了语音产品的人文关怀。下面结合附图对本发明利用汽车喇叭声纹中断车机消息播报的方法及***进行说明。

本发明提供了一种利用汽车喇叭声纹中断车机消息播报的***，该***包括有喇叭声纹模型、音频获取模块、特征提取模块、以及中断控制模块。该***可集成到车机设备的语音交互***中，也可以作为单独的产品装设到车机设备上，并与语音交互***通信连接，语音交互***内设置有消息播报***，用于接收到的需要进行消息播报的消息进行语音播报。本发明利用汽车喇叭声纹中断车机消息播报的***中的喇叭声纹模型装设于车机设备上，在***集成于车机设备的语音交互***中的情形下，该喇叭声纹模型可集成于车机设备的语音交互***中。该喇叭声纹模型与车机设备上的消息播报***连接，喇叭声纹模型还与音频获取模块、特征提取模块、以及中断控制模块连接，特征提取模块与音频获取模块连接，中断控制模块与消息播报***连接。

消息播报***在收到需要进行消息播报的消息时形成激活指令，如图1所示，在收到消息后形成激活指令发送给喇叭声纹模型以激活喇叭声纹模型。消息播报***在收到消息后，在发送激活指令的同时还进行tts播报新信息提示(tts，text to speech，从文本到语音)，利用语音交互***询问用户是否需要对新信息进行语音播报，提示后等待用户反馈。若用户反馈为播报，则该消息播报***对新信息进行语音播报，即进入语音播报流程直至完成播报，若用户反馈为不播报，则消息播报***的播报流程结束，在播报流程结束后形成结束播报指令给喇叭声纹模型以释放喇叭声纹模型。

在喇叭声纹模型被激活指令激活后，该喇叭声纹模型向音频获取模块发送录音获取指令，音频获取模块根据录音获取指令开始运行。该音频获取模块与车机设备上的麦克风控制连接，音频获取模块运行后控制车机设备上的麦克风连续不断地进行监听录音并获取所形成的录音信号，该音频获取模块还用于对获取的录音信号进行降噪处理。具体地，麦克风在被音频获取模块控制开启后，实时地进行录音，所形成的录音信号为模拟信号，该音频获取模块中设有模数转换器，形成的录音信号经模数转换器转换为数字信号。在音频获取模块中还设有降噪子模块，降噪子模块利用环境噪音对转换成数字信号的录音信号进行降噪，该降噪子模块所利用的环境噪音可以是预先存储的，也可以是在车机设备开启后录取的车内环境声音所形成的。

特征提取模块接收音频获取模块所获取的录音信号，音频获取模块对录音信号进行降噪处理后，将处理后的录音信号发送给特征提取模块，该特征提取模块用于对录音信号进行特征提取以获得对应的声纹特征，该特征提取模块所提取的声纹特征发送给喇叭声纹模型，以令喇叭声纹模型进行识别。

喇叭声纹模型在接收到特征提取模块发送的提取的声纹特征后，对该提取的声纹特征进行匹配判断，并输出匹配判断结果给中断控制模块。当匹配判断结果为所提取的声纹特征与喇叭声纹特征相匹配时，该中断控制模块根据该匹配判断结果形成中断播报指令发送给消息播报信息以中断消息播报进而使得消息播报结果；当匹配判断结果为所提取的声纹特征与喇叭声纹特征不匹配时，则中断控制模块不作处理。匹配判断结果为提取的声纹特征与喇叭声纹特征相匹配时，表示用户进行了按喇叭操作，在监听到喇叭声音时立即中断消息播报流程，实现快速及时有效的中断，以保护用户隐私，解决现有通过操作面板操作不及时的问题。

本发明中的喇叭声纹模型是通过喇叭声纹特征进行声学模型训练得到的，为了提高喇叭声纹模型识别的准确率，需要采集大量的喇叭声纹特征进行声学模型训练，且喇叭声纹特征还要通过多种环境下的喇叭声音信号进行提取获得。多种环境下的喇叭声音信号包括有汽车在不同档位行驶的环境下的喇叭声音信号，汽车在开、关窗的环境下的喇叭声音信号以及汽车内有、无背景声音的环境下的喇叭声音信号。采集喇叭声音信号时，在真实场景的不同状态中进行，若是前装车机，则需要采集该汽车车型在各种状态的喇叭声音，包括各档车速、开关窗、是否有背景声音的状态下。若是后装车机，则需要采集不同车型在各种状态的喇叭声音，对车型和上述的各档车速、开关窗、是否有背景声音的状态进行组合采集喇叭声音。

消息播报***在消息播报结束时，形成结束播报指令发送给喇叭声纹模型以释放喇叭声纹模型。该消息播报***的消息播报结束包括完成播报消息、用户反馈不播报以及中断控制模块发送中断播报指令而中断消息播报。该喇叭声纹模型在接收到结束播报指令后形成关闭指令并发送给音频获取模块、特征提取模块以及中断控制模块，令音频获取模块、特征提取模块以及中断控制模块停止运行，以待下次被激活。

本发明利用汽车喇叭声纹中断车机消息播报的***的有益效果为：

本发明的***针对车载场景且同乘车又有多个人的情况，为了避免私人信息被直接播报，在语音播报消息过程中，进行实施监听，在监听到喇叭声音，立即中断语音播报，有效保护用户隐私。

按喇叭操作在汽车使用过程中经常发生且极易操作，实现了快速及时有效的中断消息播报，解决了现有操作面板操控不及时的问题。

按喇叭还能够转移其他乘坐人的注意力，同时按喇叭的动作不会产生违和感，化解尴尬情境，提升了语音产品的人文关怀。

下面对本发明利用汽车喇叭声纹中断车机消息播报的方法进行说明。

本发明的利用汽车喇叭声纹中断车机消息播报的方法包括如下步骤：

在车机设备上建立喇叭声纹模型，该喇叭声纹模型用于识别喇叭声音；

在车机设备收到需进行消息播报的消息时，激活所建立的喇叭声纹模型，使得喇叭声纹模型处于运行状态；

通过车机设备上的麦克风连续不断地进行监听录音以获取录音信号；

对所获取的录音信号进行降噪处理并提取对应的声纹特征；

将所提取的声纹特征输入到喇叭声纹模型中进行匹配判断，即通过喇叭声纹模型对所提取的声纹特征进行识别；当所提取的声纹特征与喇叭声纹特征相匹配，则形成中断播报指令发送给车机设备以中断消息播报进而使得消息播报结束；当所提取的声纹特征与喇叭声纹特征不匹配，则继续进行匹配判断直至消息播报结束。

本发明的方法针对车机设备的语音交互***，该语音交互***内设置有消息播报***，用于接收到的需要进行消息播报的消息进行语音播报。本发明的方法对消息播报***实现控制，在消息播报的过程中，通过获取到了喇叭声音从而中断消息播报，避免了私人信息被直接播报。下面结合图1，对本发明的利用汽车喇叭声纹中断车机消息播报方法的流程进行说明。

如图1所示，消息播报***接收到新信息时，即步骤S101，收到消息，消息播报***接着执行步骤S102和步骤S107。

执行步骤S102，激活喇叭声纹模型，该消息播报***可以通过发送激活指令的方式激活喇叭声纹模型，被激活的喇叭声纹模型处于运行状态。接着执行步骤S103。

执行步骤S103，监听录音，在喇叭声纹模型被激活后，开始持续地监听录音，可以通过控制车机设备的麦克风开启进行监听录音，连续不断地录制以形成录音信号。接着执行步骤S104。

执行步骤S104，降噪处理，对所录制的录音信号进行降噪处理，可以利用实现预存的环境噪音进行降噪处理，也可以在车机设备启动时，对车内环境声音进行录制形成环境噪音。接着执行步骤S105。

执行步骤S105，对经过降噪处理的录音信号进行声纹特征提取，以提取与录音信号对应的声纹特征。接着执行步骤S106。

执行步骤S106，喇叭声纹模型对所提取的声纹特征进行匹配判断，即对所提取的声纹特征进行识别，识别其是否为喇叭声音。喇叭声纹模型将所提取的声纹特征与喇叭声纹特征进行匹配判断，若所提取的声纹特征与喇叭声纹特征相匹配，则接着执行步骤S109。若所提取的声纹特征与喇叭声纹特征不匹配，则接着执行步骤S102，以继续进行监听录音。

执行步骤S107，tts播报新信息提示，即语音提示用户收到新信息是否需要播报，接着执行步骤S108。

执行步骤S108，等待用户反馈。这步骤S107和步骤S108中接收到用户反馈后，若反馈信息为播报，则执行步骤S110，若反馈信息为不播报，则执行步骤S109。

执行步骤S110，语音播报流程，对新信息进行语音播报。接着执行步骤S111。

执行步骤S109，中断当前播报流程，接着执行步骤S111。

执行步骤S111，流程结束，语音播报流程结束，接着执行步骤S112。

执行步骤S112，释放喇叭声纹模型。

在步骤S111的流程结束中，会有多种结束情况，在语音播报完成后进入到流程结束，在用户反馈不播报而通过中断当前播报流程而进入流程结束，在喇叭声纹模型识别到有喇叭声音而通过中断当前播报流程而进入流程结束。本发明利用了喇叭声音来中断消息播报，在车机声波进行消息播报的过程中，始终对车内的环境进行监听，当监听到喇叭声音时，立即中断消息播报并取消播报流程，对车主的隐私起到了很好的保护。按喇叭的操作经常发生且极易操作，能够快速有效的中断消息播报，另外，利用喇叭中断播报，按喇叭能够转移其他同乘人员的注意力，且按喇叭的动作不会产生违和感，能够较好的化解尴尬情境，提升了语音产品的人文关怀。

本发明的方法的一较佳实施方式，在车机设备上建立喇叭声纹模型包括：

采集多种环境下的喇叭声音信号，并从所采集的喇叭声音信号中提取出对应的喇叭声纹特征，为提高喇叭声纹模型的识别准确率，需采集大量的喇叭声音信号。利用所提取的喇叭声纹特征进行声学模型训练以得到对应的喇叭声纹模型。

采集多种环境下的喇叭声音信号包括：采集汽车在不同档位行驶的环境下的喇叭声音信号；采集汽车在开、关窗的环境下的喇叭声音信号；以及采集汽车内有、无背景声音的环境下的喇叭声音信号。采集喇叭声音信号时，在真实场景的不同状态中进行，若是前装车机，则需要采集该汽车车型在各种状态的喇叭声音，包括各档车速、开关窗、是否有背景声音的状态下。若是后装车机，则需要采集不同车型在各种状态的喇叭声音，对车型和上述的各档车速、开关窗、是否有背景声音的状态进行组合采集喇叭声音。

在消息播报结束时，释放喇叭声纹模型，可通过形成结束播报指令的方式来释放喇叭声纹模型，以待下次被激活。

以上结合附图实施例对本发明进行了详细说明，本领域中普通技术人员可根据上述说明对本发明做出种种变化例。因而，实施例中的某些细节不应构成对本发明的限定，本发明将以所附权利要求书界定的范围作为本发明的保护范围。

Claims

1.一种利用汽车喇叭声纹中断车机消息播报的方法，其特征在于，包括如下步骤：

于车机设备上建立喇叭声纹模型；

所述喇叭声纹模型被激活后向音频获取模块发送录音获取指令，所述音频获取模块通过所述车机设备上的麦克风连续不断地进行监听录音以获取录音信号；

所述音频获取模块对所述录音信号进行降噪处理，将处理后的录音信号发送给特征提取模块，所述特征提取模块用于提取对应的声纹特征；以及

所述喇叭声纹模型根据所提取的声纹特征进行匹配判断，

若所提取的声纹特征与所述喇叭声纹特征不匹配，则继续进行匹配判断直至所述消息播报结束；

在消息播报结束时，车机设备上的消息播报***形成结束播报指令发送给喇叭声纹模型以释放所述喇叭声纹模型；

所述喇叭声纹模型在接收到所述结束播报指令后形成关闭指令并发送至所述音频获取模块和所述特征提取模块，以令所述音频获取模块和所述特征提取模块停止运行，以待下次被激活；

于车机设备上建立喇叭声纹模型，包括：

利用所提取的喇叭声纹特征进行声学模型训练以得到对应的喇叭声纹模型；

采集多种环境下的喇叭声音信号，包括：

采集汽车在不同档位行驶的环境下的喇叭声音信号；

采集汽车在开、关窗的环境下的喇叭声音信号；以及

采集汽车内有、无背景声音的环境下的喇叭声音信号。

2.一种利用汽车喇叭声纹中断车机消息播报的***，其特征在于，包括：

与所述喇叭声纹模型连接的音频获取模块，所述音频获取模块与所述车机设备上的麦克风控制连接，所述喇叭声纹模型被激活后向所述音频获取模块发送录音获取指令，所述音频获取模块根据所述录音获取指令控制所述麦克风连续不断地进行监听录音并获取所形成的录音信号，所述音频获取模块对所获取的所述录音信号进行降噪处理；

与所述喇叭声纹模型和所述消息播报***连接中断控制模块；

其中：

当所述匹配判断结果为所提取的声纹特征与喇叭声纹特征不匹配时，则中断控制模块不处理；

所述消息播报***在消息播报结束时，形成结束播报指令发送给所述喇叭声纹模型以释放所述喇叭声纹模型；

所述喇叭声纹模型在接收到所述结束播报指令后形成关闭指令并发送至所述音频获取模块、所述特征提取模块以及所述中断控制模块，以令所述音频获取模块、所述特征提取模块以及所述中断控制模块停止运行，以待下次被激活；

所述喇叭声纹模型通过喇叭声纹特征进行声学模型训练得到，所述喇叭声纹特征通过对多种环境下的喇叭声音信号进行提取获得；

多种环境下的喇叭声音信号包括汽车在不同档位行驶的环境下的喇叭声音信号，汽车在开、关窗的环境下的喇叭声音信号以及汽车内有、无背景声音的环境下的喇叭声音信号。