CN111145757A - 车载语音智能蓝牙集成装置和方法 - Google Patents
车载语音智能蓝牙集成装置和方法 Download PDFInfo
- Publication number
- CN111145757A CN111145757A CN202010099827.8A CN202010099827A CN111145757A CN 111145757 A CN111145757 A CN 111145757A CN 202010099827 A CN202010099827 A CN 202010099827A CN 111145757 A CN111145757 A CN 111145757A
- Authority
- CN
- China
- Prior art keywords
- voice
- vehicle
- bluetooth
- recording
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 230000010354 integration Effects 0.000 title claims abstract description 11
- 230000003993 interaction Effects 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 27
- 230000009467 reduction Effects 0.000 claims abstract description 14
- 238000004891 communication Methods 0.000 claims description 14
- 230000002452 interceptive effect Effects 0.000 abstract description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 244000062793 Sorghum vulgare Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephone Function (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
本发明提供一种车载语音智能蓝牙集成装置和方法,由麦克或麦克阵列录音以及由LineIn录音获得第一录音,经过回声消除、语音增强、语音降噪得到第二录音;第二录音通过离线识别单元进行本地语音识别或者通过手机语音助手单元进行云端识别,识别后得到交互消息或者设备控制消息,交互消息由手机语音助手单元执行返回音频输出,设备控制类消息传输至汽车控制中心处理。通过智能语音识别处理,促成普通的车载蓝牙智能化,让车载蓝牙连接手机,以手机为中心,使得车载蓝牙轻松拥有AI智能交互能力,无需动手让用户和车载设备进行语音交互,让车载蓝牙设备获得第三方云端识别的能力和资源,进而变得真正智能起来,赋予车载蓝牙新的竞争力。
Description
技术领域
本发明涉及汽车蓝牙技术领域,具体地,涉及一种车载语音智能蓝牙集成装置和方法。
背景技术
在汽车内进行通话、导航基本上需要依赖于手机,目前汽车车载***里都集成了车载蓝牙,手机连接车载蓝牙后,电话的通话可以通过车载蓝牙来录音,汽车喇叭来播放。手机上导航的声音也通过汽车喇叭来播放。此车载蓝牙一般采用普通蓝牙装置,没有语音交互功能,因此造成车内通话、导航无法智能化应用。
与本申请相关的现有技术是专利文献202535357U,公开了一种汽车蓝牙来电转接装置,涉及车载多媒体;它包括:手机,所述手机包括手机主控电路及与所述主控电路信号连接的蓝牙模组A;车载多媒体,所述车载多媒体包括车载音响、设置于车载音响的车载音响主控电路、车载麦克风以及设置于车载麦克风的麦克风主控电路;所述车载多媒体还包括一来电切换模块以及与所述来电切换模块信号连接的蓝牙模组B,所述来电切换模块分别与所述车载音响主控电路及所述麦克风主控电路信号连接,所述蓝牙模组A与所述蓝牙模组B蓝牙信号连接。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种车载语音智能蓝牙集成装置和方法。
根据本发明提供的一种车载语音智能蓝牙集成装置,包括回声消除单元、语音增强单元、语音降噪单元、离线识别单元;
由麦克或者麦克阵列以及由LineIn录音获得第一录音,第一录音经过回声消除单元,再依次经过语音增强单元、语音降噪单元,得到第二录音;
第二录音通过离线识别单元进行本地语音识别处理。
优选地,所述的车载语音智能蓝牙集成装置,还包括手机语音助手单元,所述第二录音通过手机语音助手单元进行云端语音识别处理和语义处理。
优选地,所述离线识别单元是对第二录音进行语音识别得到第一识别结果和第一提示音音频,第一提示音音频通过车载语音智能蓝牙集成装置的DAC接口单元输出。
优选地,所述手机语音助手单元是将第二录音通过蓝牙协议接口单元传输至手机语音助手APP进行云端语音识别处理和语义处理得到第二识别结果;
若第二识别结果被标识为语音交互类消息,则在手机语音助手APP上执行,执行结束生成第二音频,手机语音助手APP将第二音频通过蓝牙传输至车载语音智能蓝牙集成装置的DAC接口单元输出;
若第二识别结果被标识为车载设备控制类消息,则手机语音助手APP通过蓝牙传输至车载语音智能蓝牙集成装置,并与离线识别单元得到的第一识别结果进行比较,生成第三识别结果。
优选地,所述的车载语音蓝牙集成装置,还包括通信接口单元,所述第三识别结果通过通信接口单元连接汽车控制中心,以实现语音控制车载设备。
优选地,所述本地语音识别处理的处理优先级高于云端语音识别处理和语义处理。
优选地,所述蓝牙协议接口单元对语音交互类消息采用蓝牙BLE协议传输,对第二音频采用经典蓝牙协议传输。
优选地,所述语音交互类消息包括语音导航、语音电话、播放歌曲、控制设备、播报天气、播报时间、播报日期、播报新闻、讲故事和讲笑话。
根据本发明提供的一种车载语音智能蓝牙集成方法,包括:
回声消除步骤:由麦克或麦克阵列以及由LineIn录音获取第一录音,令第一录音消除回声,抵消汽车喇叭播放的声音,保留用户说话声音,形成中间录音;
语音增强降噪步骤:令中间录音进行语音增强和语音降噪,形成第二录音;
离线识别步骤:对第二录音进行本地语音识别处理,得到第一识别结果和第一提示音音频,第一识别结果和第一提示音音频通过DAC接口单元输出至汽车喇叭;
手机语音助手步骤:对第二录音进行通过蓝牙协议接口单元传输至手机语音助手APP进行云端识别得到第二识别结果;若第二识别结果被标识为语音交互类消息,则在手机语音助手APP上执行,执行结束生成第二音频,手机语音助手APP将第二音频通过蓝牙传输至车载语音智能蓝牙集成装置的DAC接口单元输出;若第二识别结果被标识为车载设备控制类消息,则手机语音助手APP通过蓝牙传输至车载语音智能蓝牙集成装置,并与离线识别单元得到的第一识别结果进行比较,生成第三识别结果。
优选地,所述的车载语音智能蓝牙集成方法,还包括车载设备控制步骤,令第三识别结果通过通信接口单元连接汽车控制中心,以实现语音控制车载设备,所述离线识别步骤的执行优先于手机语音助手步骤。
与现有技术相比,本发明具有如下的有益效果:
1、本发明扩充了现有普通车载蓝牙的应用场景,通过手机连接车载蓝牙,使得车载蓝牙轻松拥有AI智能交互能力;
2、本发明实现用户和车载设备进行语音交互,使得车载蓝牙获得第三方云端识别的能力和资源,提成普通车载蓝牙的新竞争力。
3、本发明中,语音智能蓝牙离开手机,也同样拥有AI能力,支持离线语音控制车载设备(车窗、空调、车灯等),极大的完善了车载产品使用场景。
4、由于车载环境通常相对复杂,车内噪音来源包括风切声、引擎声、冷气风扇声以及其他机械所产生的声音,本发明采用麦克风阵列、语音增强、语音降噪将处理后的干净、高信噪比的语音录音再去做识别处理,识别距离远,可以覆盖车里每个座位。同时汽车喇叭在播放广播和音乐时,本发明采用回声消除的方式,可以实现喇叭播放时,同样可以语音唤醒,完全实现不用动手操作,大大提高了语音交互的体验。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的框架示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
为了解决目前普通车载蓝牙的不足,引入语音智能蓝牙,以手机为中心,将语音智能蓝牙集成在车载***里,不改变用户使用手机的习惯,是接下来车载蓝牙变革的方向和未来。采用手机通过蓝牙连接普通车载蓝牙进行语音交互中,会受到汽车噪音的影响,并受限于语音识别距离,以及其他交互控制的阻碍。通过语音智能蓝牙能够在汽车行驶过程中接收到清晰无噪的语音,语音的接收不受距离限制,即使是汽车后排的乘客也能直接进行语音交互。
本发明提供的车载语音智能蓝牙集成装置是促成普通的车载蓝牙智能化,让车载蓝牙连接手机,以手机为中心,使得车载蓝牙轻松拥有AI智能交互能力,具备和智能音箱一样的用户体验,无需动手,就可以让用户和车载设备进行语音交互,也能让车载蓝牙设备获得第三方云端识别的能力和资源,进而变得真正智能起来,赋予车载蓝牙新的竞争力,同时语音智能蓝牙集成离线语音识别,支持离线语音控制车载设备。
由麦克或者麦克阵列以及由LineIn录音获得第一录音,第一录音经过回声消除单元,再依次经过语音增强单元、语音降噪单元,得到第二录音;第二录音通过离线识别单元进行本地语音识别处理,得到第一识别结果和第一提示音音频,第一提示音音频通过DAC接口单元输出至汽车的功放电路,再通过汽车喇叭播放;第二录音通过蓝牙传输至手机语音助手单元进行云端语音识别和语义理解处理得到第二识别结果,云端语音识别包含了语音交互类消息和车载设备控制类消息,其中语音交互类消息包括导航、音乐播放、通话等交互信息,若第二识别结果属于语音交互类消息,则在手机语音助手APP上进行执行,并将执行过程和执行结果显示在手机语音助手APP上,执行完毕后生成需要播放的第二音频,通过蓝牙将第二音频传输至语音智能蓝牙模块,第二音频通过智能蓝牙模块的DAC接口单元输出至汽车的功放电路,再通过汽车喇叭播放。若第二识别结果属于对于车载设备控制类消息,手机语音助手APP则通过蓝牙将第二识别结果传输至语音智能蓝牙,第一识别结果和第二识别结果通过语音智能蓝牙综合处理后获得第三识别结果,第三识别结果通过通信接口单元连接汽车控制中心,实现语音控制车载设备。在蓝牙协议接口单元中,对车载控制类消息采用蓝牙BLE协议传输,对音频类消息采用经典蓝牙协议传输,其中,本申请中车载控制类消息的第二识别结果采用蓝牙BLE协议传输,音频类消息的第二音频,采用经典蓝牙协议传输。
手机语音助手单元可以采用通用的终端产品,例如手机、pad、车载移动终端等。例如百度的小度app,小米的小爱同学app、阿里的天猫精灵app等等,这些语音助手app里集成了导航、电话、音乐等很多语音交互的技能。
手机语音助手单元也可以采用汽车厂商通过定制开发的软件产品,所述软件产品集成了导航、电话、播放器等交互功能,且能够通过云服务器进行语音识别、语义理解。语音识别和语义理解可以采用现有的公有云产品,也可以采用汽车厂商的私有云产品。
本发明中的回声消除、语音增强、语音降噪和离线识别分别采用相应的算法引擎,这些处理方式对于本领域技术人员来说,可以通过现有技术进行实现,此处不做详细描述。
如图1所示,麦克或麦克阵列(MIC或MIC Array)录音(录进去用户说话和汽车喇叭播放的声音),LineIn录音(录进去汽车喇叭播放的回声),送入语音智能蓝牙模块里的回声消除(AEC)引擎,抵消喇叭播放的声音,保留用户说话声音,再进行语音增强(AGC)和语音降噪(NS),最后送入语音识别(ASR)引擎去做识别计算,实现了语音打断唤醒和离线语音识别控制。
语音智能蓝牙模块将回声消除(AEC)、语音增强(AGC)、语音降噪(NS)前端处理后的高信噪比、干净的录音通过蓝牙5.0(蓝牙BLE协议)传到手机的语音助手APP,语音助手APP里集成了导航、电话、播放器等功能,APP把录音送到云端人工智能服务器去做语音识别和语义理解。云端语音识别结果包含了语音交互类消息和云端车载设备控制类消息,其中语音交互类消息包括导航、音乐播放、通话等交互信息,语音交互类消息则在手机语音助手APP上进行执行,并将执行过程和执行结果显示在手机语音助手APP上,执行完毕后生成需要播放的音频,音频通过蓝牙传给语音智能蓝牙模块,语音智能蓝牙模块的DAC接汽车功放电路,由汽车喇叭播放出来。云端识别结果里的车载设备控制类消息,手机语音助手APP则通过蓝牙将识别结果传输至语音智能蓝牙模块,云端识别和离线语音控制的识别结果,综合判断后将识别结果通过通信接口连接汽车控制中心,实现语音控制车载设备。
·语音智能蓝牙模块的语音唤醒和离线语音控制后播放的提示音,模块的DAC接汽车功放,汽车喇叭播放出来。
·语音交互过程中,采用离线(本地)+在线(云端)同时识别的方式,策略如下:
1.语音智能蓝牙模块没有连接手机语音助手APP的时候,采用本地语音识别进行处理。仅支持语音唤醒、车载设备离线语音控制等功能。
2.语音智能蓝牙模块连接语音助手APP的时候,离线加在线同时识别的方式,支持所有功能。利用离线语音识别的识别时间短,无识别延时的优势,优先采用离线语音识别结果,离线识别有结果时,采用离线识别的结果,在线识别结果不做处理。比如用户说“打开空调”,离线识别有识别结果,在线识别也有识别结果,则语音智能蓝牙模块要做个综合判断,离线识别结束后,获得离线识别结果,则在线识别结果不做处理,语音智能蓝牙模块把离线识别结果通过通信接口连接汽车控制中心,实现语音控制车载空调。
3.利用在线云端识别的识别内容更丰富,如离线无法识别的内容,再采用在线识别结果。在线识别可采用海量词汇量语音识别和丰富的音频内容,包括了用户的导航、歌曲点播、通话以及所有查询和对话交互内容。比如用户说“播放张信哲的爱如潮水”,离线无法识别,云端识别后,在手机语音助手app上播放爱如潮水,把歌曲的音频通过蓝牙传给语音智能蓝牙模块,语音智能蓝牙模块的DAC输出接到汽车的功放电路再通过汽车喇叭播放出来。再比如用户说“帮我把车里空调调到26度”,离线无法识别这么复杂的说法内容,云端识别后,手机助手app输出识别结果到语音智能蓝牙模块,语音智能蓝牙综合判断后采用云端识别结果(离线没有识别结果)通过通信接口连接汽车控制中心,实现语音控制车载空调。
·语音控制,语音智能蓝牙模块离线或在线语音识别后,通过通信接口(比如CANBUS)连接汽车控制中心,实现语音控制车载设备。
应用场景举例如下:
唤醒词:长安你好
离线语音控制车载设备(芯片端):
打开空调、关闭空调、制冷/制热模式、16~30度、打开内循环/外循环等等。
打开车窗、关闭车窗、打开天窗、打开/折叠后视镜,打开左前车窗等等。
打开车外灯、关闭车外灯、打开车内灯、关闭车内灯、打开雾灯、关闭雾灯、打开氛围灯、关闭氛围灯等等。
播放音乐、暂停播放、增大音量、减小音量、上一首、下一首、接听电话、挂断电话等等。
在线语音交互(语音助手app端):
导航:导航到徐家汇、导航到虹桥火车站、附近哪里有加油站等等。
电话:打电话给10086、张三等等。
歌曲:播放张信哲的爱如潮水/刘德华的忘情水
车载设备控制:帮我把车里空调调到26度,车里氛围灯调到红色。
天气:上海今天/明天/后天天气怎么样,上海今天会下雨吗?
时间:现在几点
日期:今天几号
新闻:有什么体育新闻/财经新闻
故事:讲一个小红帽的故事
笑话:讲一个冷笑话
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的***、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的***、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的***、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (10)
1.一种车载语音智能蓝牙集成装置,其特征在于,包括回声消除单元、语音增强单元、语音降噪单元、离线识别单元;
由麦克或者麦克阵列以及由LineIn录音获得第一录音,第一录音经过回声消除单元,再依次经过语音增强单元、语音降噪单元,得到第二录音;
第二录音通过离线识别单元进行本地语音识别处理。
2.根据权利要求1所述的车载语音智能蓝牙集成装置,其特征在于,还包括手机语音助手单元,所述第二录音通过手机语音助手单元进行云端语音识别处理和语义处理。
3.根据权利要求1所述的车载语音智能蓝牙集成装置,其特征在于,所述离线识别单元是对第二录音进行语音识别得到第一识别结果和第一提示音音频,第一提示音音频通过车载语音智能蓝牙集成装置的DAC接口单元输出。
4.根据权利要求2所述的车载语音智能蓝牙集成装置,其特征在于,所述手机语音助手单元是将第二录音通过蓝牙协议接口单元传输至手机语音助手APP进行云端语音识别处理和语义处理得到第二识别结果;
若第二识别结果被标识为语音交互类消息,则在手机语音助手APP上执行,执行结束生成第二音频,手机语音助手APP将第二音频通过蓝牙传输至车载语音智能蓝牙集成装置的DAC接口单元输出;
若第二识别结果被标识为车载设备控制类消息,则手机语音助手APP通过蓝牙传输至车载语音智能蓝牙集成装置,并与离线识别单元得到的第一识别结果进行比较,生成第三识别结果。
5.根据权利要求4所述的车载语音蓝牙集成装置,其特征在于,还包括通信接口单元,所述第三识别结果通过通信接口单元连接汽车控制中心,以实现语音控制车载设备。
6.根据权利要求1所述的车载语音智能蓝牙集成装置,其特征在于,所述本地语音识别处理的处理优先级高于云端语音识别处理和语义处理。
7.根据权利要求4所述的车载语音智能蓝牙集成装置,其特征在于,所述蓝牙协议接口单元对语音交互类消息采用蓝牙BLE协议传输,对第二音频采用经典蓝牙协议传输。
8.根据权利要求4所述的车载语音智能蓝牙集成装置,其特征在于,所述语音交互类消息包括语音导航、语音电话、播放歌曲、控制设备、播报天气、播报时间、播报日期、播报新闻、讲故事和讲笑话。
9.一种车载语音智能蓝牙集成方法,其特征在于,包括:
回声消除步骤:由麦克或麦克阵列以及由LineIn录音获取第一录音,令第一录音消除回声,抵消汽车喇叭播放的声音,保留用户说话声音,形成中间录音;
语音增强降噪步骤:令中间录音进行语音增强和语音降噪,形成第二录音;
离线识别步骤:对第二录音进行本地语音识别处理,得到第一识别结果和第一提示音音频,第一识别结果和第一提示音音频通过DAC接口单元输出至汽车喇叭;
手机语音助手步骤:对第二录音进行通过蓝牙协议接口单元传输至手机语音助手APP进行云端识别得到第二识别结果;若第二识别结果被标识为语音交互类消息,则在手机语音助手APP上执行,执行结束生成第二音频,手机语音助手APP将第二音频通过蓝牙传输至车载语音智能蓝牙集成装置的DAC接口单元输出;若第二识别结果被标识为车载设备控制类消息,则手机语音助手APP通过蓝牙传输至车载语音智能蓝牙集成装置,并与离线识别单元得到的第一识别结果进行比较,生成第三识别结果。
10.根据权利要求9所述的车载语音智能蓝牙集成方法,其特征在于,还包括车载设备控制步骤,令第三识别结果通过通信接口单元连接汽车控制中心,以实现语音控制车载设备,所述离线识别步骤的执行优先于手机语音助手步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010099827.8A CN111145757A (zh) | 2020-02-18 | 2020-02-18 | 车载语音智能蓝牙集成装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010099827.8A CN111145757A (zh) | 2020-02-18 | 2020-02-18 | 车载语音智能蓝牙集成装置和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111145757A true CN111145757A (zh) | 2020-05-12 |
Family
ID=70527635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010099827.8A Pending CN111145757A (zh) | 2020-02-18 | 2020-02-18 | 车载语音智能蓝牙集成装置和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111145757A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112153521A (zh) * | 2020-09-09 | 2020-12-29 | 上海仙塔智能科技有限公司 | 车载音箱控制***及车载音箱 |
CN112153522A (zh) * | 2020-09-09 | 2020-12-29 | 上海仙塔智能科技有限公司 | 车载音箱控制***及车载音箱 |
CN112309416A (zh) * | 2020-10-20 | 2021-02-02 | 中国第一汽车股份有限公司 | 车载语音回音消除方法、***、车辆和存储介质 |
CN113099353A (zh) * | 2021-04-21 | 2021-07-09 | 浙江吉利控股集团有限公司 | 一种用于车辆的集成麦克风、安全带、方向盘及车辆 |
CN113190647A (zh) * | 2021-04-15 | 2021-07-30 | 北京小米移动软件有限公司 | 媒体文件播放方法、媒体文件播放装置及存储介质 |
JP2022037100A (ja) * | 2020-12-22 | 2022-03-08 | 北京百度網訊科技有限公司 | 車載機器の音声処理方法、装置、機器及び記憶媒体 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104754500A (zh) * | 2015-04-16 | 2015-07-01 | 芜湖宏景电子股份有限公司 | 基于蓝牙传输的车载终端与智能手机语音声控互联互控*** |
CN106340297A (zh) * | 2016-09-21 | 2017-01-18 | 广东工业大学 | 一种基于云计算与置信度计算的语音识别方法与*** |
CN207173531U (zh) * | 2017-07-26 | 2018-04-03 | 青岛科技大学 | 一种基于ble的多功能车载助手 |
CN109036415A (zh) * | 2018-10-22 | 2018-12-18 | 广东格兰仕集团有限公司 | 一种智能冰箱的语音控制*** |
CN109102804A (zh) * | 2018-08-17 | 2018-12-28 | 飞救医疗科技(赣州)有限公司 | 一种语音病历终端输入的方法及其*** |
CN110211577A (zh) * | 2019-07-19 | 2019-09-06 | 宁波方太厨具有限公司 | 终端设备及其语音交互方法 |
CN209785547U (zh) * | 2019-02-25 | 2019-12-13 | 深圳市相位科技有限公司 | 一种基于双麦克风降噪的车载语音安全装置 |
CN212010364U (zh) * | 2020-02-18 | 2020-11-24 | 上海华镇电子科技有限公司 | 车载语音智能蓝牙集成装置 |
-
2020
- 2020-02-18 CN CN202010099827.8A patent/CN111145757A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104754500A (zh) * | 2015-04-16 | 2015-07-01 | 芜湖宏景电子股份有限公司 | 基于蓝牙传输的车载终端与智能手机语音声控互联互控*** |
CN106340297A (zh) * | 2016-09-21 | 2017-01-18 | 广东工业大学 | 一种基于云计算与置信度计算的语音识别方法与*** |
CN207173531U (zh) * | 2017-07-26 | 2018-04-03 | 青岛科技大学 | 一种基于ble的多功能车载助手 |
CN109102804A (zh) * | 2018-08-17 | 2018-12-28 | 飞救医疗科技(赣州)有限公司 | 一种语音病历终端输入的方法及其*** |
CN109036415A (zh) * | 2018-10-22 | 2018-12-18 | 广东格兰仕集团有限公司 | 一种智能冰箱的语音控制*** |
CN209785547U (zh) * | 2019-02-25 | 2019-12-13 | 深圳市相位科技有限公司 | 一种基于双麦克风降噪的车载语音安全装置 |
CN110211577A (zh) * | 2019-07-19 | 2019-09-06 | 宁波方太厨具有限公司 | 终端设备及其语音交互方法 |
CN212010364U (zh) * | 2020-02-18 | 2020-11-24 | 上海华镇电子科技有限公司 | 车载语音智能蓝牙集成装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112153521A (zh) * | 2020-09-09 | 2020-12-29 | 上海仙塔智能科技有限公司 | 车载音箱控制***及车载音箱 |
CN112153522A (zh) * | 2020-09-09 | 2020-12-29 | 上海仙塔智能科技有限公司 | 车载音箱控制***及车载音箱 |
CN112153521B (zh) * | 2020-09-09 | 2023-01-24 | 上海仙塔智能科技有限公司 | 车载音箱控制***及车载音箱 |
CN112309416A (zh) * | 2020-10-20 | 2021-02-02 | 中国第一汽车股份有限公司 | 车载语音回音消除方法、***、车辆和存储介质 |
CN112309416B (zh) * | 2020-10-20 | 2022-11-29 | 中国第一汽车股份有限公司 | 车载语音回音消除方法、***、车辆和存储介质 |
JP2022037100A (ja) * | 2020-12-22 | 2022-03-08 | 北京百度網訊科技有限公司 | 車載機器の音声処理方法、装置、機器及び記憶媒体 |
EP3958256A3 (en) * | 2020-12-22 | 2022-06-15 | Apollo Intelligent Connectivity (Beijing) Technology Co., Ltd. | Voice processing method, apparatus, device and storage medium for vehicle-mounted device |
JP7213943B2 (ja) | 2020-12-22 | 2023-01-27 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 車載機器の音声処理方法、装置、機器及び記憶媒体 |
CN113190647A (zh) * | 2021-04-15 | 2021-07-30 | 北京小米移动软件有限公司 | 媒体文件播放方法、媒体文件播放装置及存储介质 |
CN113099353A (zh) * | 2021-04-21 | 2021-07-09 | 浙江吉利控股集团有限公司 | 一种用于车辆的集成麦克风、安全带、方向盘及车辆 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111145757A (zh) | 车载语音智能蓝牙集成装置和方法 | |
US8738368B2 (en) | Speech processing responsive to a determined active communication zone in a vehicle | |
CN102030008B (zh) | 情绪咨询*** | |
US8019454B2 (en) | Audio processing system | |
CN113345433B (zh) | 一种车外语音交互*** | |
US9620146B2 (en) | Speech communication system for combined voice recognition, hands-free telephony and in-car communication | |
CN109754803A (zh) | 车载多音区语音交互***及方法 | |
CN106910510A (zh) | 车载功放设备、车辆及其音频播放处理方法 | |
US20050216271A1 (en) | Speech dialogue system for controlling an electronic device | |
US20130211828A1 (en) | Speech processing responsive to active noise control microphones | |
CN110475170A (zh) | 耳机播放状态的控制方法、装置、移动终端及存储介质 | |
CN106782589A (zh) | 移动终端及其语音输入方法和装置 | |
CN102243870A (zh) | 语音合成中的语音调节 | |
CN113060153A (zh) | 用于调整活动控制参数的***和方法 | |
JP2022002942A (ja) | 車両内のボイスコールのためのシステム及び方法 | |
CN110696756A (zh) | 一种车辆的音量控制方法及装置、汽车、存储介质 | |
US10540985B2 (en) | In-vehicle media vocal suppression | |
CN112614491A (zh) | 一种车载语音交互方法、装置、车辆、可读介质 | |
CN212010364U (zh) | 车载语音智能蓝牙集成装置 | |
CN102857847B (zh) | 公共交通降噪*** | |
CN114530154A (zh) | 车载机器人及其操作方法、介质和计算机程序产品 | |
CN215933190U (zh) | 一种基于车载智能网联的语音识别*** | |
CN212647873U (zh) | 汽车智能语音***及车辆 | |
WO2022059214A1 (ja) | 車載装置及び車載システム | |
US20220210593A1 (en) | Combining prerecorded and live performances in a vehicle |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |