CN109637532A - 语音识别方法、装置、车载终端、车辆及存储介质 - Google Patents

语音识别方法、装置、车载终端、车辆及存储介质 Download PDF

Info

Publication number
CN109637532A
CN109637532A CN201811590011.4A CN201811590011A CN109637532A CN 109637532 A CN109637532 A CN 109637532A CN 201811590011 A CN201811590011 A CN 201811590011A CN 109637532 A CN109637532 A CN 109637532A
Authority
CN
China
Prior art keywords
voice
user
sound
presently
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811590011.4A
Other languages
English (en)
Inventor
彭汉迎
陈建哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811590011.4A priority Critical patent/CN109637532A/zh
Publication of CN109637532A publication Critical patent/CN109637532A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Navigation (AREA)

Abstract

本申请实施例提供一种语音识别方法、装置、车载终端、车辆及存储介质。包括:通过N个音区中的麦克风获取用户的语音;判断语音在用户的当前所处音区是否有效;若语音在用户的当前所处音区有效,则根据语音触发相应操作。从而满足用户对车辆智能化的需求。

Description

语音识别方法、装置、车载终端、车辆及存储介质
技术领域
本申请实施例涉及车联网技术,尤其涉及一种语音识别方法、装置、车载终端、车辆及存储介质。
背景技术
随着车联网技术的不断发展,用户对车辆的要求越来越智能化。其中,用户与车辆之间的语音交互是车辆智能化的一个重要体现。例如:用户通过语音输入可以进行实时导航、播放音乐、自动驾驶等。
现有技术中,车辆上设置至少一个音区,每个音区设置至少一个麦克风,只要车载终端可以识别到语音,车载终端都会根据该语音触发相应的操作,例如:播放音乐,实现导航等。然而,这种不考虑用户权限的语音识别方式并不适用于所有的场景,例如:通常用户希望在导航场景下,车载终端仅识别驾驶员的语音。因此,现有技术仍然无法满足用户对车辆智能化的需求。
发明内容
本申请实施例提供一种语音识别方法、装置、车载终端、车辆及存储介质。从而满足用户对车辆智能化的需求。
第一方面,本申请提供一种语音识别方法,方法应用于车载终端或车辆,车辆上设置有N个音区,N为大于1的整数,每个音区设置至少一个麦克风,方法包括:通过N个音区中的麦克风获取用户的语音;判断语音在用户的当前所处音区是否有效;若语音在用户的当前所处音区有效,则根据语音触发相应操作。
本申请有益效果包括:车载终端通过N个音区中的麦克风获取用户的语音。判断用户的语音在用户的当前所处音区是否有效。若用户的语音在用户的当前所处音区有效,则车载终端根据用户的语音触发相应操作。相反,若用户的语音在用户的当前所处音区无效,则车载终端不触发任何操作。该方法适用于所有的场景,例如:通常用户希望在导航场景下,车载终端仅识别驾驶员的语音。从而满足用户对车辆智能化的需求。
可选地,判断语音在用户的当前所处音区是否有效,包括:提取语音的关键词;根据关键词判断语音在用户的当前所处音区是否有效。
可选地,根据关键词判断语音在用户的当前所处音区是否有效,包括:若关键词不是预设关键词,则确定语音在用户的当前所处音区有效;若关键词是预设关键词,则确定预设关键词对应的至少一个预设位置信息;若至少一个预设位置信息包括当前所处音区的位置信息,则确定语音在用户的当前所处音区有效;若至少一个预设位置信息不包括当前所处音区的位置信息,则确定语音在用户的当前所处音区无效。
本申请有益效果包括:通过上述方法可以有效的确定语音在用户的当前所处音区是否有效。进一步地,若用户的语音在用户的当前所处音区有效,则车载终端根据用户的语音触发相应操作。相反,若用户的语音在用户的当前所处音区无效,则车载终端不触发任何操作。该方法适用于所有的场景,例如:通常用户希望在导航场景下,车载终端仅识别驾驶员的语音。从而满足用户对车辆智能化的需求。
可选地,方法还包括:若至少一个预设位置信息不包括当前所处音区的位置信息,则推送提示信息,提示信息用于提示语音在用户的当前所处音区无效。从而满足用户对车辆智能化的需求。
可选地,方法还包括:确定N个音区中的麦克风分别获取到的语音的幅值;根据N个音区中的麦克风分别获取到的语音的幅值,确定用户的当前所处音区。
可选地,根据N个音区中的麦克风分别获取到的语音的幅值,确定用户的当前所处音区,包括:确定N个音区中的麦克风分别获取到的语音的幅值中的最大值;将最大值对应的音区确定为用户的当前所处音区。
下面将提供一种车载终端、车辆、存储介质及计算机程序产品。其效果可参考方法部分。
第二方面,本申请提供一种车载终端,车载终端所在车辆上设置有N个音区,N为大于1的整数,每个音区设置至少一个麦克风,车载终端包括:收发器和处理器,收发器用于通过N个音区中的麦克风获取用户的语音;处理器用于判断语音在用户的当前所处音区是否有效;若语音在用户的当前所处音区有效,则根据语音触发相应操作。
第三方面,本申请提供一种车载终端,车载终端所在车辆上设置有N个音区,N为大于1的整数,每个音区设置至少一个麦克风,车载终端包括:获取模块、判断模块和触发模块。获取模块用于通过N个音区中的麦克风获取用户的语音;判断模块用于判断语音在用户的当前所处音区是否有效;触发模块用于若语音在用户的当前所处音区有效,则根据语音触发相应操作。
第四方面,本申请提供一种车辆,包括车体和用于执行如第一方面或第一方面的可选方式的车载终端。
第五方面,本申请提供一种存储介质,包括:可读存储介质和计算机指令,计算机指令存储在可读存储介质中;计算机指令用于实现第一方面或第一方面的可选方式的方法。
第六方面,本申请提供一种计算机程序产品,包括:计算机指令,计算机指令用于实现第一方面或第一方面的可选方式的方法。
本申请实施例提供一种语音识别方法、装置、车载终端、车辆及存储介质。包括:通过N个音区中的麦克风获取用户的语音;判断语音在用户的当前所处音区是否有效;若语音在用户的当前所处音区有效,则根据语音触发相应操作。相反,若用户的语音在用户的当前所处音区无效,则车载终端不触发任何操作。该方法适用于所有的场景,例如:通常用户希望在导航场景下,车载终端仅识别驾驶员的语音。从而满足用户对车辆智能化的需求。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请一实施例提供的应用场景示意图;
图2为本申请一实施例提供的语音识别方法的流程图;
图3为本申请一实施例提供的语音识别方法的流程图;
图4为本申请一实施例提供的语音识别方法的流程图;
图5为本申请一实施例提供的车载终端50的示意图;
图6为本申请一实施例提供的车载终端60的示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
目前许多车辆都具有多个音区,在每个音区设置有至少一个麦克风,麦克风用于实现拾音功能。最常见的情况是:车辆设置有四个音区,这四个音区分别设置在车内的前后左右四个位置。
如上所述,在现有技术中,只要车载终端可以识别到语音,车载终端都会根据该语音触发相应的操作,例如:播放音乐,实现导航等。然而,这种不考虑用户权限的语音识别方式并不适用于所有的场景,例如:通常用户希望在导航场景下,车载终端仅识别驾驶员的语音。因此,现有技术仍然无法满足用户对车辆智能化的需求。
为了解决上述技术问题,本申请提供一种语音识别方法、装置、车载终端、车辆及存储介质。其中,本申请技术方案的应用场景如下:图1为本申请一实施例提供的应用场景示意图,其中,车辆设置有N个音区(图1以设置四个音区为例,分别是A、B、C、D四个音区),N为大于1的整数,每个音区设置至少一个麦克风11(图1以一个音区设置一个麦克风为例)。车辆内还设置有车载终端12(图1以车载终端12设置在音区A为例)。基于该应该场景,下面将对本申请技术方案进行详细介绍:
实施例一
图2为本申请一实施例提供的语音识别方法的流程图,该方法应用于车载终端或车辆,如图1所示,该车辆上设置有N个音区,N为大于1的整数,每个音区设置至少一个麦克风,下面以该方法由车载终端执行为例,对语音识别方法进行说明。具体地,如图2所示,所述语音识别方法包括如下步骤:
步骤S201:车载终端通过N个音区中的麦克风获取用户的语音。
步骤S202:车载终端判断用户的语音在所述用户的当前所处音区是否有效。
步骤S203:若用户的语音在所述用户的当前所处音区有效,则车载终端根据用户的语音触发相应操作。
其中,车载终端通过如下方式确定用户的当前所处音区:
一种可选方式:车载终端确定所述N个音区中的麦克风分别获取到的所述语音的幅值;根据所述N个音区中的麦克风分别获取到的所述语音的幅值,确定所述用户的当前所处音区。例如:车载终端确定所述N个音区中的麦克风分别获取到的所述语音的幅值中的最大值;将所述最大值对应的音区确定为所述用户的当前所处音区。其中,当车载终端确定的所述最大值为多个时,车载终端可以随机选择一个最大值对应的音区,并将选择的音区确定为所述用户的当前所处音区。
另一种可选方式:车载终端确定所述用户的语音传输到每个麦克风的传输时长,确定这些传输时长中的最小值,将所述最小值对应的音区确定为所述用户的当前所处音区。其中,当车载终端确定的所述最小值为多个时,车载终端可以随机选择一个最小值对应的音区,并将选择的音区确定为所述用户的当前所处音区。
进一步地,车载终端判断用户的语音在所述用户的当前所处音区是否有效,至少包括如下两种可选方式:
可选方式一:车载终端提取所述用户的语音的关键词,根据所述关键词判断所述语音在所述用户的当前所处音区是否有效。
可选方式二:车载终端直接根据用户的语音判断所述语音在所述用户的当前所处音区是否有效。
可选地,若用户的语音在所述用户的当前所处音区有效,则车载终端根据用户的语音触发相应操作,例如:假设用户的语音为“导航去甲广场”,则车载终端触发导航***,目的地为甲广场。或者,假设用户的语音为“打开天窗”,则车载终端触发控制***,以打开天窗。或者,假设用户的语音为“播放音乐”,则车载终端自动与手机进行蓝牙连接,以播放手机中的音乐。
可选地,若用户的语音在所述用户的当前所处音区无效,则车载终端不触发任何操作。或者,车载终端推送提示信息,以提示用户的语音在所述用户的当前所处音区无效,或者,用户在当前所处音区无权限。例如:假设用户的语音为“导航去甲广场”,而用户的当前所述音区为B音区,该B音区为副驾驶所在音区,这时车载终端可以推送提示信息,该提示信息可以以语音形式播放,如“尊敬的用户,您没有导航权限”。
综上,在本申请实施例中,车载终端通过N个音区中的麦克风获取用户的语音。判断用户的语音在所述用户的当前所处音区是否有效。若用户的语音在所述用户的当前所处音区有效,则车载终端根据用户的语音触发相应操作。相反,若用户的语音在所述用户的当前所处音区无效,则车载终端不触发任何操作。该方法适用于所有的场景,例如:通常用户希望在导航场景下,车载终端仅识别驾驶员的语音。从而满足用户对车辆智能化的需求。
下面对上述步骤S202涉及的第一种可选方式进行详细说明:
实施例二
图3为本申请一实施例提供的语音识别方法的流程图,该方法应用于车载终端或车辆,如图1所示,该车辆上设置有N个音区,N为大于1的整数,每个音区设置至少一个麦克风,下面以该方法由车载终端执行为例,对语音识别方法进行说明。具体地,如图3所示,所述语音识别方法包括如下步骤:
步骤S301:车载终端通过N个音区中的麦克风获取用户的语音。
步骤S302:若关键词不是预设关键词,则车载终端确定所述语音在所述用户的当前所处音区有效。
步骤S303:若所述关键词是预设关键词,则车载终端确定所述预设关键词对应的至少一个预设位置信息。
步骤S304:若所述至少一个预设位置信息包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区有效。
步骤S305:若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区无效。
步骤S306:若用户的语音在所述用户的当前所处音区有效,则车载终端根据用户的语音触发相应操作。
其中,步骤S301与步骤S201相同,步骤S306与步骤S203相同,其内容可参考实施例一。
步骤S202包括:步骤S302至步骤S305。下面对步骤S302至步骤S305进行详细说明:
可选地,车载终端本地或者云端存储有至少一个预设关键词和每个预设关键词对应的至少一个预设位置信息,具体可以将至少一个预设关键词和每个预设关键词对应的至少一个预设位置信息存储至map容器中。例如:当预设关键词为“导航”时,该预设关键词对应的预设位置信息为A音区的位置信息,其中,A音区是驾驶员所在的区域。或者,当预设关键词为“开启”时,该预设关键词对应的预设位置信息为A音区的位置信息。
若关键词不是预设关键词,则车载终端确定所述语音在所述用户的当前所处音区有效。这种情况,说明用户的语音是普通语音,即不受音区限制的语音,例如:用户的语音为“播放音乐”,这时用户在任一个音区都可以触发播放音乐这一操作。或者,用户的语音为“打开收音机”,这时用户在任一个音区都可以触发打开收音机这一操作。
若所述关键词是预设关键词,则车载终端确定所述预设关键词对应的至少一个预设位置信息。若所述至少一个预设位置信息包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区有效。若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区无效。例如:用户的语音是“导航去甲影院”,车载终端提取的关键词是“导航”,该关键词是预设关键词,而该预设关键词对应的预设位置信息为A音区的位置信息,这时当用户的当前所处音区为A音区时,则车载终端触发导航功能。相反,若用户的当前所处音区不是A音区时,则车载终端不触发任何操作。
可选地,终端设备可以采用现有的关键词提取方法进行关键词提取。或者,终端设备采用如下方式进行关键词提取:首先将语音划分为多个词汇,其次,确定每个词汇的出现频率,最后将出现频率最高的词汇作为关键词。或者,首先将语音划分为多个词汇,其次,确定每个词汇的属性,其中词汇的属性可以是动词、名词等,最后将目标属性的词汇作为关键词,例如:将动词作为关键词,比如“导航”、“开启”、“播放”等。
在本申请实施例中,若关键词不是预设关键词,则车载终端确定所述语音在所述用户的当前所处音区有效。若所述关键词是预设关键词,则车载终端确定所述预设关键词对应的至少一个预设位置信息。若所述至少一个预设位置信息包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区有效。若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区无效。通过上述方法可以有效的确定语音在所述用户的当前所处音区是否有效。进一步地,若用户的语音在所述用户的当前所处音区有效,则车载终端根据用户的语音触发相应操作。相反,若用户的语音在所述用户的当前所处音区无效,则车载终端不触发任何操作。该方法适用于所有的场景,例如:通常用户希望在导航场景下,车载终端仅识别驾驶员的语音。从而满足用户对车辆智能化的需求。
下面对上述步骤S202涉及的第二种可选方式进行详细说明:
实施例三
图4为本申请一实施例提供的语音识别方法的流程图,该方法应用于车载终端或车辆,如图1所示,该车辆上设置有N个音区,N为大于1的整数,每个音区设置至少一个麦克风,下面以该方法由车载终端执行为例,对语音识别方法进行说明。具体地,如图4所示,所述语音识别方法包括如下步骤:
步骤S401:车载终端通过N个音区中的麦克风获取用户的语音。
步骤S402:若所述用户的语音不是预设语音,则车载终端确定所述语音在所述用户的当前所处音区有效。
步骤S403:若所述用户的语音与预设语音匹配成功,则车载终端确定所述预设语音对应的至少一个预设位置信息。
步骤S404:若所述至少一个预设位置信息包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区有效。
步骤S405:若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区无效。
步骤S406:若用户的语音在所述用户的当前所处音区有效,则车载终端根据用户的语音触发相应操作。
其中,步骤S401与步骤S201相同,步骤S406与步骤S203相同,其内容可参考实施例一。
步骤S202包括:步骤S402至步骤S405。下面对步骤S402至步骤S405进行详细说明:
可选地,车载终端本地或者云端存储有至少一个预设语音和每个预设语音对应的至少一个预设位置信息,具体可以将至少一个预设语音和每个预设语音对应的至少一个预设位置信息存储至map容器中。例如:当预设语音为“导航去乙地方”时,该预设语音对应的预设位置信息为A音区的位置信息,其中,A音区是驾驶员所在的区域。或者,当预设语音为“开启雨刷器”时,该预设语音对应的预设位置信息为A音区的位置信息。
若用户的语音不是预设语音,则车载终端确定所述语音在所述用户的当前所处音区有效。这种情况,说明用户的语音是普通语音,即不受音区限制的语音,例如:用户的语音为“播放音乐”,这时用户在任一个音区都可以触发播放音乐这一操作。或者,用户的语音为“打开收音机”,这时用户在任一个音区都可以触发打开收音机这一操作。
若用户的语音与预设用户的语音匹配成功,则车载终端确定所述预设用户的语音对应的至少一个预设位置信息。若所述至少一个预设位置信息包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区有效。若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区无效。
其中,通过如下方式可以确定用户的语音与预设用户的语音是否匹配成功,当用户的语音与预设用户的语音的匹配度大于预设匹配度时,确定用户的语音与预设用户的语音匹配成功。当用户的语音与预设用户的语音的匹配度小于或等于预设匹配度时,确定用户的语音与预设用户的语音匹配失败,其中,该预设匹配度可以为30%,40%等,本申请对如何确定预设匹配度不做限制。
假设终端设备已经根据用户的语音确定用户的当前所处音区为A音区。而车载终端本地或者云端存储有多个预设语音,每个预设语音对应至少一个预设位置信息,例如:预设语音为“导航去乙地方”,该预设对应的预设位置信息为A音区的位置信息。基于此,车载终端获取到语音:“导航去甲影院”时,车载终端对预设语音和用户的语音进行匹配,这时假设匹配度大于预设匹配度,则车载终端确定对所述用户的语音匹配成功,并确定匹配到的预设语音所对应的预设位置信息为A音区的位置信息,若用户的当前所处音区的位置信息也是A音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区有效,若用户的当前所处音区的位置信息不是A音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区无效。
在本申请实施例中,若所述用户的语音不是预设语音,则车载终端确定所述语音在所述用户的当前所处音区有效。若所述用户的语音与预设语音匹配成功,则车载终端确定所述预设语音对应的至少一个预设位置信息。若所述至少一个预设位置信息包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区有效。若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则车载终端确定所述语音在所述用户的当前所处音区无效。通过上述方法可以有效的确定语音在所述用户的当前所处音区是否有效。进一步地,若用户的语音在所述用户的当前所处音区有效,则车载终端根据用户的语音触发相应操作。相反,若用户的语音在所述用户的当前所处音区无效,则车载终端不触发任何操作。该方法适用于所有的场景,例如:通常用户希望在导航场景下,车载终端仅识别驾驶员的语音。从而满足用户对车辆智能化的需求。
实施例四
图5为本申请一实施例提供的车载终端50的示意图,所述车载终端所在车辆上设置有N个音区,N为大于1的整数,每个音区设置至少一个麦克风,如图5所示,所述车载终端包括:
获取模块501,用于通过所述N个音区中的麦克风获取用户的语音。
判断模块502,用于判断所述语音在所述用户的当前所处音区是否有效。
触发模块503,用于若所述语音在所述用户的当前所处音区有效,则根据所述语音触发相应操作。
可选地,判断模块502具体用于:提取所述语音的关键词;根据所述关键词判断所述语音在所述用户的当前所处音区是否有效。
可选地,判断模块502具体用于:若所述关键词不是预设关键词,则确定所述语音在所述用户的当前所处音区有效;若所述关键词是预设关键词,则确定所述预设关键词对应的至少一个预设位置信息;若所述至少一个预设位置信息包括所述当前所处音区的位置信息,则确定所述语音在所述用户的当前所处音区有效;若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则确定所述语音在所述用户的当前所处音区无效。
可选地,车载终端50还包括:
推送模块504,用于若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则推送提示信息,所述提示信息用于提示所述语音在所述用户的当前所处音区无效。
可选地,车载终端50还包括:
第一确定模块505,用于确定所述N个音区中的麦克风分别获取到的所述语音的幅值。
第二确定模块506,用于根据所述N个音区中的麦克风分别获取到的所述语音的幅值,确定所述用户的当前所处音区。
可选地,第二确定模块506具体用于:确定所述N个音区中的麦克风分别获取到的所述语音的幅值中的最大值;将所述最大值对应的音区确定为所述用户的当前所处音区。
本申请实施例提供一种车载终端,其可以执行上述的语音识别方法,具体内容和效果可参考方法部分,对此不再赘述。
实施例五
图6为本申请一实施例提供的车载终端60的示意图,所述车载终端所在车辆上设置有N个音区,N为大于1的整数,每个音区设置至少一个麦克风,如图6所示,所述车载终端包括:
收发器601,用于通过所述N个音区中的麦克风获取用户的语音;
处理器602,用于:
判断所述语音在所述用户的当前所处音区是否有效;
若所述语音在所述用户的当前所处音区有效,则根据所述语音触发相应操作。
可选地,所述处理器602具体用于:提取所述语音的关键词;根据所述关键词判断所述语音在所述用户的当前所处音区是否有效。
可选地,所述处理器602具体用于:若所述关键词不是预设关键词,则确定所述语音在所述用户的当前所处音区有效;若所述关键词是预设关键词,则确定所述预设关键词对应的至少一个预设位置信息;若所述至少一个预设位置信息包括所述当前所处音区的位置信息,则确定所述语音在所述用户的当前所处音区有效;若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则确定所述语音在所述用户的当前所处音区无效。
可选地,所述收发器601还用于:若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则推送提示信息,所述提示信息用于提示所述语音在所述用户的当前所处音区无效。
可选地,所述处理器602还用于:确定所述N个音区中的麦克风分别获取到的所述语音的幅值;根据所述N个音区中的麦克风分别获取到的所述语音的幅值,确定所述用户的当前所处音区。
可选地,所述处理器602具体用于:确定所述N个音区中的麦克风分别获取到的所述语音的幅值中的最大值;将所述最大值对应的音区确定为所述用户的当前所处音区。
可选地,车载终端60还包括:存储器603,该存储器603用于存储计算机指令,所述处理器602通过执行所述计算机指令,从而实现上述语音识别方法。
本申请实施例提供一种车载终端,其可以执行上述的语音识别方法,具体内容和效果可参考方法部分,对此不再赘述。
本申请一实施例还提供一种车辆,包括车体和用于执行上述语音识别方法的车载终端。
本申请还提供一种存储介质,包括:可读存储介质和计算机指令,计算机指令存储在可读存储介质中;计算机指令用于实现上述语音识别方法,其内容和效果参考方法部分,本申请实施例对此不再赘述。
本申请还提供一种计算机程序产品,包括:计算机指令,计算机指令存储在可读存储介质中;计算机指令用于实现上述语音识别方法,其内容和效果参考方法部分,本申请实施例对此不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:只读存储器(英文:read-only memory,缩写:ROM)、RAM、快闪存储器、硬盘、固态硬盘、磁带(英文:magnetictape)、软盘(英文:floppy disk)、光盘(英文:optical disc)及其任意组合。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (15)

1.一种语音识别方法,其特征在于,所述方法应用于车载终端或车辆,所述车辆上设置有N个音区,N为大于1的整数,每个音区设置至少一个麦克风,所述方法包括:
通过所述N个音区中的麦克风获取用户的语音;
判断所述语音在所述用户的当前所处音区是否有效;
若所述语音在所述用户的当前所处音区有效,则根据所述语音触发相应操作。
2.根据权利要求1所述的方法,其特征在于,所述判断所述语音在所述用户的当前所处音区是否有效,包括:
提取所述语音的关键词;
根据所述关键词判断所述语音在所述用户的当前所处音区是否有效。
3.根据权利要求2所述的方法,其特征在于,所述根据所述关键词判断所述语音在所述用户的当前所处音区是否有效,包括:
若所述关键词不是预设关键词,则确定所述语音在所述用户的当前所处音区有效;
若所述关键词是预设关键词,则确定所述预设关键词对应的至少一个预设位置信息;
若所述至少一个预设位置信息包括所述当前所处音区的位置信息,则确定所述语音在所述用户的当前所处音区有效;
若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则确定所述语音在所述用户的当前所处音区无效。
4.根据权利要求3所述的方法,其特征在于,还包括:
若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则推送提示信息,所述提示信息用于提示所述语音在所述用户的当前所处音区无效。
5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:
确定所述N个音区中的麦克风分别获取到的所述语音的幅值;
根据所述N个音区中的麦克风分别获取到的所述语音的幅值,确定所述用户的当前所处音区。
6.根据权利要求5所述的方法,其特征在于,所述根据所述N个音区中的麦克风分别获取到的所述语音的幅值,确定所述用户的当前所处音区,包括:
确定所述N个音区中的麦克风分别获取到的所述语音的幅值中的最大值;
将所述最大值对应的音区确定为所述用户的当前所处音区。
7.一种车载终端,其特征在于,所述车载终端所在车辆上设置有N个音区,N为大于1的整数,每个音区设置至少一个麦克风,所述车载终端包括:
收发器,用于通过所述N个音区中的麦克风获取用户的语音;
处理器,用于:
判断所述语音在所述用户的当前所处音区是否有效;
若所述语音在所述用户的当前所处音区有效,则根据所述语音触发相应操作。
8.根据权利要求7所述的车载终端,其特征在于,所述处理器具体用于:
提取所述语音的关键词;
根据所述关键词判断所述语音在所述用户的当前所处音区是否有效。
9.根据权利要求8所述的车载终端,其特征在于,所述处理器具体用于
若所述关键词不是预设关键词,则确定所述语音在所述用户的当前所处音区有效;
若所述关键词是预设关键词,则确定所述预设关键词对应的至少一个预设位置信息;
若所述至少一个预设位置信息包括所述当前所处音区的位置信息,则确定所述语音在所述用户的当前所处音区有效;
若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则确定所述语音在所述用户的当前所处音区无效。
10.根据权利要求9所述的车载终端,其特征在于,所述收发器还用于:
若所述至少一个预设位置信息不包括所述当前所处音区的位置信息,则推送提示信息,所述提示信息用于提示所述语音在所述用户的当前所处音区无效。
11.根据权利要求7-10任一项所述的车载终端,其特征在于,所述处理器还用于:
确定所述N个音区中的麦克风分别获取到的所述语音的幅值;
根据所述N个音区中的麦克风分别获取到的所述语音的幅值,确定所述用户的当前所处音区。
12.根据权利要求11所述的车载终端,其特征在于,所述处理器具体用于:
确定所述N个音区中的麦克风分别获取到的所述语音的幅值中的最大值;
将所述最大值对应的音区确定为所述用户的当前所处音区。
13.一种车载终端,其特征在于,所述车载终端所在车辆上设置有N个音区,N为大于1的整数,每个音区设置至少一个麦克风,所述车载终端包括:
获取模块,用于通过所述N个音区中的麦克风获取用户的语音;
判断模块,用于判断所述语音在所述用户的当前所处音区是否有效;
触发模块,用于若所述语音在所述用户的当前所处音区有效,则根据所述语音触发相应操作。
14.一种车辆,其特征在于,包括车体和用于执行如权利要求1-6任一项所述方法的车载终端。
15.一种存储介质,其特征在于,包括:可读存储介质和计算机指令,所述计算机指令存储在所述可读存储介质中;所述计算机指令用于实现权利要求1-6任一项所述方法。
CN201811590011.4A 2018-12-25 2018-12-25 语音识别方法、装置、车载终端、车辆及存储介质 Pending CN109637532A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811590011.4A CN109637532A (zh) 2018-12-25 2018-12-25 语音识别方法、装置、车载终端、车辆及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811590011.4A CN109637532A (zh) 2018-12-25 2018-12-25 语音识别方法、装置、车载终端、车辆及存储介质

Publications (1)

Publication Number Publication Date
CN109637532A true CN109637532A (zh) 2019-04-16

Family

ID=66077263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811590011.4A Pending CN109637532A (zh) 2018-12-25 2018-12-25 语音识别方法、装置、车载终端、车辆及存储介质

Country Status (1)

Country Link
CN (1) CN109637532A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070868A (zh) * 2019-04-28 2019-07-30 广州小鹏汽车科技有限公司 车载***的语音交互方法、装置、汽车和机器可读介质
CN110211585A (zh) * 2019-06-05 2019-09-06 广州小鹏汽车科技有限公司 车内娱乐互动方法、装置、车辆和机器可读介质
CN110366156A (zh) * 2019-08-26 2019-10-22 科大讯飞(苏州)科技有限公司 车载蓝牙通讯处理方法、车载音频管理***及相关设备
CN111660773A (zh) * 2020-05-29 2020-09-15 奇瑞汽车股份有限公司 一种应用汽车上的声控车窗方法和***
CN111986678A (zh) * 2020-09-03 2020-11-24 北京蓦然认知科技有限公司 一种多路语音识别的语音采集方法、装置
CN113808611A (zh) * 2021-09-17 2021-12-17 深圳地平线机器人科技有限公司 音频播放方法、装置、计算机可读存储介质及电子设备
CN114582336A (zh) * 2020-12-02 2022-06-03 上海擎感智能科技有限公司 交互方法、车载终端及计算机可读存储介质
CN115440206A (zh) * 2022-03-16 2022-12-06 北京罗克维尔斯科技有限公司 多音区语音识别方法、装置、车辆及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102800315A (zh) * 2012-07-13 2012-11-28 上海博泰悦臻电子设备制造有限公司 车载语音控制方法及***
CN105957523A (zh) * 2016-04-22 2016-09-21 乐视控股(北京)有限公司 车载***控制方法及装置
DE102016212647A1 (de) * 2015-12-18 2017-06-22 Volkswagen Aktiengesellschaft Verfahren zum Betreiben eines Sprachsteuerungssystems in einem Innenraum und Sprachsteuerungssystem

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102800315A (zh) * 2012-07-13 2012-11-28 上海博泰悦臻电子设备制造有限公司 车载语音控制方法及***
DE102016212647A1 (de) * 2015-12-18 2017-06-22 Volkswagen Aktiengesellschaft Verfahren zum Betreiben eines Sprachsteuerungssystems in einem Innenraum und Sprachsteuerungssystem
CN105957523A (zh) * 2016-04-22 2016-09-21 乐视控股(北京)有限公司 车载***控制方法及装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070868A (zh) * 2019-04-28 2019-07-30 广州小鹏汽车科技有限公司 车载***的语音交互方法、装置、汽车和机器可读介质
CN110070868B (zh) * 2019-04-28 2021-10-08 广州小鹏汽车科技有限公司 车载***的语音交互方法、装置、汽车和机器可读介质
CN110211585A (zh) * 2019-06-05 2019-09-06 广州小鹏汽车科技有限公司 车内娱乐互动方法、装置、车辆和机器可读介质
CN110366156A (zh) * 2019-08-26 2019-10-22 科大讯飞(苏州)科技有限公司 车载蓝牙通讯处理方法、车载音频管理***及相关设备
CN110366156B (zh) * 2019-08-26 2021-03-26 科大讯飞(苏州)科技有限公司 通讯处理方法、装置、设备、存储介质及音频管理***
CN111660773A (zh) * 2020-05-29 2020-09-15 奇瑞汽车股份有限公司 一种应用汽车上的声控车窗方法和***
CN111660773B (zh) * 2020-05-29 2023-02-03 奇瑞汽车股份有限公司 一种应用汽车上的声控车窗方法和***
CN111986678A (zh) * 2020-09-03 2020-11-24 北京蓦然认知科技有限公司 一种多路语音识别的语音采集方法、装置
CN111986678B (zh) * 2020-09-03 2023-12-29 杭州蓦然认知科技有限公司 一种多路语音识别的语音采集方法、装置
CN114582336A (zh) * 2020-12-02 2022-06-03 上海擎感智能科技有限公司 交互方法、车载终端及计算机可读存储介质
CN113808611A (zh) * 2021-09-17 2021-12-17 深圳地平线机器人科技有限公司 音频播放方法、装置、计算机可读存储介质及电子设备
CN115440206A (zh) * 2022-03-16 2022-12-06 北京罗克维尔斯科技有限公司 多音区语音识别方法、装置、车辆及存储介质

Similar Documents

Publication Publication Date Title
CN109637532A (zh) 语音识别方法、装置、车载终端、车辆及存储介质
WO2022001013A1 (zh) 语音交互方法、车辆、服务器、***和存储介质
JP5183176B2 (ja) 双方向スピーチ認識システム
JP4353212B2 (ja) 単語列認識装置
US7822613B2 (en) Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus
US20170032786A1 (en) Centralized method and system for determining voice commands
JP4804052B2 (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
US10984788B2 (en) User-guided arbitration of speech processing results
US20150039316A1 (en) Systems and methods for managing dialog context in speech systems
CN100422916C (zh) 选择列表项的方法和特别是用于机动车的信息***或娱乐***
JP2017146437A (ja) 音声入力処理装置
US20030144845A1 (en) Voice command interpreter with dialog focus tracking function and voice command interpreting method
US20030014255A1 (en) Device and method for the speech input of a destination into a destination guiding system by means of a defined input dialogue
JP4156563B2 (ja) 単語列認識装置
CN108717346A (zh) 一种基于车机的应用管理方法、装置、设备和介质
CN108055617A (zh) 一种麦克风的唤醒方法、装置、终端设备及存储介质
US20200160862A1 (en) In-vehicle device and speech recognition method
CN110232924A (zh) 车载语音管理方法、装置、车辆及存储介质
CN105609105A (zh) 语音识别***和语音识别方法
CN109976515B (zh) 一种信息处理方法、装置、车辆及计算机可读存储介质
CN112017651B (zh) 电子设备的语音控制方法、装置、计算机设备和存储介质
KR102217653B1 (ko) 차량용 인포테인먼트 시스템 및 그의 제어 방법과 그를 포함하는 차량
CN110473524A (zh) 语音识别***的构建方法和装置
CN107545895B (zh) 信息处理方法和电子设备
WO2022217621A1 (zh) 语音交互的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190416

RJ01 Rejection of invention patent application after publication