CN117672210A - 语音控制方法、装置、存储介质及电子设备 - Google Patents

语音控制方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN117672210A
CN117672210A CN202211096441.7A CN202211096441A CN117672210A CN 117672210 A CN117672210 A CN 117672210A CN 202211096441 A CN202211096441 A CN 202211096441A CN 117672210 A CN117672210 A CN 117672210A
Authority
CN
China
Prior art keywords
vehicle
control
voice
configuration
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211096441.7A
Other languages
English (en)
Inventor
丁云
刘怡丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pateo Connect Nanjing Co Ltd
Original Assignee
Pateo Connect Nanjing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pateo Connect Nanjing Co Ltd filed Critical Pateo Connect Nanjing Co Ltd
Priority to CN202211096441.7A priority Critical patent/CN117672210A/zh
Publication of CN117672210A publication Critical patent/CN117672210A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开提供了语音控制方法、装置、存储介质及电子设备,该方法包括:响应于接收到的第一语音请求,确定所述第一语音请求对应的车辆型号以及车控对象;响应于配置信息中所述车辆型号存在与所述车控对象匹配的配置对象、且所述配置对象支持语音控制,确定控制指令;响应于所述控制指令,对车机进行语音控制。在本公开提供的技术方案中,预先存储配置信息,一套配置信息可以适配多款车型,从而实现为每款车型快速适配语音功能,无需人工针对不同车辆型号进行不同的配置,配置效率较高,用时较短,人工成本较低,准确性较高。

Description

语音控制方法、装置、存储介质及电子设备
技术领域
本公开涉及车辆通信技术领域,且更具体地,涉及语音控制方法、装置、存储介质及电子设备。
背景技术
随着智能技术的不断发展,车辆内部使用语音场景越来越多,车辆厂家通常拥有较多的产品线,每条产品线的车型配置均有差异,因此在相关技术中在为车辆进行语音功能配置时,需要人工逐一进行语音功能的匹配,配置语音功能的时间较长,效率较低。
发明内容
本公开提供了语音控制方法、装置、计算机可读存储介质及电子设备,以解决现有的车辆语音功能配置效率较低的技术问题。
第一方面,提供了一种语音控制方法,具体包括如下步骤:
响应于接收到的第一语音请求,确定所述第一语音请求对应的车辆型号以及车控对象;
响应于配置信息中所述车辆型号存在与所述车控对象匹配的配置对象、且所述配置对象支持语音控制,确定控制指令;
响应于所述控制指令,对车机进行语音控制。
第二方面,提供了一种语音控制装置,具体包括如下模块:
请求处理模块,被配置为响应于接收到的第一语音请求,确定所述第一语音请求对应的车辆型号以及车控对象;
指令确定模块,被配置为响应于配置信息中所述车辆型号存在与所述车控对象匹配的配置对象、且所述配置对象支持语音控制,确定控制指令;
控制处理模块,被配置为响应于所述控制指令,对车机进行语音控制。
第三方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述的语音控制方法。
第四方面,提供了一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述的语音控制方法。
与现有技术相比,本公开提供的语音控制方法、装置、计算机可读存储介质及电子设备,至少包括以下有益效果:
本公开提供的技术方案接收第一语音请求,不同的第一语音请求可能对应不同的用户意图,进而会对应不同的车辆型号以及不同的车控对象,因此响应于接收到第一语音请求,确定第一语音请求对应的车辆型号以及车控对象。将车辆型号以及车控对象与预先配置的配置信息进行比较,在配置信息中该车辆型号下存在与车控对象匹配的配置对象,且配置对象支持语音控制的情况下,即可以确定控制指令,利用该控制指令对车机的配置对象进行语音控制。在本公开提供的技术方案中预先存储配置信息,一套配置信息可以适配多款车型,从而实现为每款车型快速适配语音功能,无需人工针对不同车辆型号进行不同的配置,配置效率较高,用时较短,人工成本较低,准确性较高。
附图说明
为了更清楚地说明本公开的技术方案,下面将对本公开的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本公开一示例性实施例提供的语音控制方法的流程示意图一;
图2是本公开一示例性实施例提供的语音控制方法的流程示意图二;
图3是本公开一示例性实施例提供的语音控制方法的流程示意图三;
图4是本公开一示例性实施例提供的语音控制装置的结构示意图;
图5是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
下面将结合本公开中的附图,对本公开中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部实施例。基于本公开中的实施例,本领域普通技术人员在没有创造性劳动前提下所获得的所有其他实施例,都属于本公开实施例保护的范围。
示例性方法
图1是本公开一示例性实施例提供的语音控制方法的流程示意图,该语音控制方法可以应用车机或服务器,该服务器可以为云端服务器,具体包括如下步骤:
步骤S11,响应于接收到的第一语音请求,确定所述第一语音请求对应的车辆型号以及车控对象。
其中,第一语音请求为用户发出的用于进行语音控制的指令。车辆型号对应用户意图控制车辆的编码信息,不同型号的车辆编码信息不同,用于进行车型的区分。车控对象为用户意图通过语音进行控制的车内设备。
在一种可能的实现方式中,第一语音请求包括语音内容和型号参数,语音内容为用户的说话内容,型号参数为发送第一语音请求时携带的语音内容外的参数,用于确定车辆型号。
在一种可能的应用场景中,本实施例提供的方法应用于云端服务器,用户驾驶A车辆时说出“打开天幕”,车辆内部语音采集装置采集该语音信号,并通过车机向云端服务器发送语音内容为“打开天幕”的第一语音请求,该第一语音请求不仅携带有语音内容,还携带有型号参数,因此在获取到第一语音请求时,读取型号参数,确定出A车辆的车辆型号,进一步根据第一语音请求的语音内容确定车控对象,在语音内容为“打开天幕”的情况下,车控对象为天幕。
在一种可能的实现方式中,第一语音请求的语音内容包括车辆型号以及车控对象。
在一种可能的应用场景中,本实施例提供的方法应用于云端服务器,用户驾驶A车辆时说出“打开A1(一种车辆型号)的天幕”,车辆内部语音采集装置采集该语音信号,并向云端服务器发送语音内容为“打开A1的天幕”的第一语音请求,根据该第一语音请求,确定出车辆型号为A1,车控对象为天幕。
在一种可能的实现方式中,第一语音请求的语音内容包括车辆型号以及车控对象,同时第一语音请求还携带有型号参数。此时可以进行设置,如以携带的型号参数为准,避免用户说出的车辆型号不正确的情况。
在一种可能的实现方式中,本实施例提供的方法应用于车机,预先在车机内部存储型号参数。具体地,车辆内部语音采集装置采集语音信号后,生成第一语音请求,若确定的第一语音请求的语音内容为“打开天幕”,根据该语音内容确定车控对象为天幕,并读取车辆内部预先存储型号参数作为车辆型号。
在一些实施例中,所述步骤S11中确定所述第一语音请求对应的车控对象,包括:
步骤S111,确定所述第一语音请求对应的语义识别结果。
步骤S112,响应于所述语义识别结果属于车控垂域,确定所述语义识别结果对应的车控对象。
具体地,预先进行垂域的划分,如车控垂域,用于对车辆进行控制,音乐垂域,用于进行音乐进行分析。在接收到第一语音请求后,响应于该第一语音请求,确定第一语音请求进行语义识别,确定出语义识别结果。示例性的,预先训练语义识别模型,将第一语音请求输入至语义识别模型中,确定语义识别模型输出的语义识别结果。进一步地,判断该语义识别结果是否属于车控垂域,在语义识别结果属于车控垂域的情况下,表明用户意图通过语音对车辆进行控制,因此确定语义识别结果对应的车控对象;在语义识别结果不属于车控垂域的情况下,表明用户无意通过语音对车辆进行控制,因此结束当前流程,无需进行后续步骤。在本实施例中,通过对垂域进行划分,实现对语音控制的精细化管理,保证语音控制的准确性以及车控对象确认的有效性。
在一些实施例中,所述步骤S112,包括:
步骤S1121,响应于所述语义识别结果属于车控垂域、且所述语义识别结果包括预设疑问词语义,调用预先存储的知识库进行查询,确定所述语义识别结果对应的车控对象。
其中,预设疑问词语义是指预先设定的具有疑问词性质的词语,例如,怎、怎么、怎样、怎么样、怎么着、如何、为什么等。知识库中存储着大量用于进行语义确定的内容,如存储有与车控垂域相关的知识内容。根据该知识库中的内容可以更加准确地确定用户意图,保证车控对象确定的准确性。
具体地,判断语义识别结果是否属于车控垂域,在语义识别结果属于车控垂域的情况下,判断该语义识别结果是否包括预设疑问词语义,在包括预设疑问词语义的情况下,表明可能无法通过该第一语音请求的语音内容确定出车控对象,因此调用预先存储的知识库进行查询,查询出与语义识别结果对象的车控对象。
在一种可能的应用场景中,若第一语音请求的语音内容为“怎样打开天幕”,在对该语音内容进行语义识别后,确定出的语义识别结果属于车控垂域,且语义识别结果包括预设疑问词语义“怎样”,因此调用知识库,确定该语义识别结果对应的车控对象为“天幕”。若第一语音请求的语音内容为“如何快速降低车内温度”,在对该语音内容进行语义识别后,确定出的语义识别结果属于车控垂域,且语义识别结果包括预设疑问词语义“如何”,因此调用知识库,确定该语义识别结果对应的车控对象为“空调”。
步骤S1122,响应于所述语义识别结果属于车控垂域、且所述语义识别结果不包括预设疑问词语义,在所述语义识别结果中提取出车控对象。
具体地,在判断语义识别结果是否包括预设疑问词语义时,若语义识别结果不包括预设疑问词语义的情况下,表明用户可能是对某车控对象直接下达的语音指令,如“打开天幕”,“打开空调”,等,因此可以根据语义识别结果提取出车控对象,即“打开天幕”中的“天幕”,“打开空调”中的“空调”。
在一种可能的实现方式中,若在语义识别结果中无法提取出车控对象,可以进一步调用预先存储的知识库进行查询,确定语义识别结果对应的车控对象。
需要说明的是,当然也可以响应于所述语义识别结果属于车控垂域,直接调用预先存储的知识库进行查询,确定所述语义识别结果对应的车控对象,以保证车控对象确定的准确性。
在本实施例中,在语义识别结果属于车控垂域的情况下,针对语义识别结果是否包括预设疑问词语义进行不同的处理,在包括预设疑问词语义时,可能无法直接在语义识别结果中提取出车控对象,或提取出的对象不是用户意图控制的车内设备,因此为了保证车控对象确定的准确性,根据预先存储的知识库,准确地确定出车控对象。在语义识别结果不包括预设疑问词语义时,可以在语义识别结果中快速提取出车控对象,保证车控对象的确定效率,节约计算资源。
步骤S12,响应于配置信息中所述车辆型号存在与所述车控对象匹配的配置对象、且所述配置对象支持语音控制,确定控制指令。
其中,配置信息中包括不同车辆型号的车辆配置以及车辆配置的语音控制信息,也就是说一套配置信息可以适用于多个车型。配置信息可以为车型配置表,示例性的,车型配置表的内容可以为,A1(车辆型号):天窗、360°全景摄像头、倒车视频影像等;A2(车辆型号):天幕、倒车视频影像;A3(车辆型号):天窗、倒车视频影像。支持语音控制的有天窗、天幕和全景摄像头,从而该车型配置表可以同时适用于A1、A2、A3,避免对A1、A2、A3人工进行逐一配置。需要说明的是,在需要进行产品迭代时,可以对配置信息进行更新,无需OTA(Over the air,空中下载)版本升级,升级效率较好。
具体地,在确定车辆型号和车控对象后,确定配置信息中该车辆型号下是否存在与车控对象匹配的配置对象,若存在与车控对象匹配的配置对象,确定该配置对象是否支持语音控制,在该配置对象支持语音控制的情况下,确定控制指令,通过该控制指令可以实现对配置对象进行控制。
在一种可能的应用场景中,用户驾驶A1车辆,说出“打开天窗”,即第一语音请求的语音内容为“打开天窗”,携带的型号参数为A1,从而确定出车辆型号:A1,车控对象:天窗。读取配置信息,根据配置信息可知A1车型设置有天窗,即配置信息中存在与车控对象匹配的配置对象:天窗,且天窗支持语音控制,因此确定“打开天窗”的控制指令,利用该控制指令,打开车辆的天窗。
在一些实施例中,所述步骤S12前,所述方法还包括:
步骤S14,响应于所述配置信息中所述车辆型号存在所述车控对象,所述配置信息中所述车辆型号存在与所述车控对象匹配的配置对象。
具体地,在获取到车辆型号和车控对象后,确定配置信息中该车辆型号下是否存在车控对象,在配置信息中存在车控对象时,判定配置信息中该车辆型号存在与车控对象匹配的配置对象。
举例来说,车辆型号为A1,车控对象为天窗,配置信息中存储有A1,A1设置有天窗,天窗即为匹配的配置对象,此时车控对象与配置对象具有一致性。
步骤S15,响应于所述配置信息中所述车辆型号不存在所述车控对象,确定与所述车控对象存在对应关系的转化控制对象。
步骤S16,响应于所述配置信息中所述车辆型号存在所述转化控制对象,所述配置信息中所述车辆型号存在与所述车控对象匹配的配置对象。
在步骤S15和步骤S16中,预先设置不同车内设备间的对应关系,如天窗和天幕间的对应关系,即为实现相似功能、但存在级别差异的车内设备设置对应关系,存在级别差异往往表现为高配置和低配置间的差异。
具体地,在配置信息中该车辆型号不存在车控对象的情况下,进一步确定与车控对象存在对应关系的转化控制对象,在配置信息中存在转化控制对象的情况下,该转化控制对象为车控对象匹配的配置对象,此时车控对象与配置对象不具有一致性。
举例来说,预先设置天窗和天幕间的对应关系。若第一语音请求为“打开天窗”,并确定出车辆型号为A2,车控对象为天窗,配置信息中存储有A2,A2设置有天幕,也就是说在配置信息中不存在车控对象天窗,确定与天窗存在对应关系的转化控制对象即天幕,A2对应的配置信息中存在转化控制对象天幕,进而可以判定配置信息中车辆型号存在与车控对象匹配的配置对象。因此可以进一步生成天幕相关的控制指令,如将天幕透光率调到了最高。利用该控制指令对天幕进行控制后,可以进一步进行语音反馈如“这辆车还没有天窗哦,先帮你把天幕透光率调到最高了”,相较于直接接受到语音反馈“暂不支持此功能”,本实施例提供的方法可以更为深入地解析用户的意图并明确反馈提示信息,使得用户更加了解车辆,便于下次进行语音控制。
在本实施例中,通过配置具有对应关系的车内设备,使得在用户不能准确掌握车内设备的情况下,也可以准确地对配置对象进行控制,为用户提供便利。
步骤S13,响应于所述控制指令,对车机进行语音控制。
具体地,在确定控制指令后,利用该控制指令对车机进行语音控制。在本公开提供的方法应用于车机时,生成控制指令后,直接对车机进行进一步控制,在本公开提供的方法应用于云端服务器时,生成控制指令后,将该控制指令返回给车机,车机接收到云端服务器返回的控制指令后,对配置对象进行控制。
本实施例提供的技术方案接收第一语音请求,不同的第一语音请求可能对应不同的用户意图,进而会对应不同的车辆型号以及不同的车控对象,因此响应于接收到第一语音请求,确定第一语音请求对应的车辆型号以及车控对象。将车辆型号以及车控对象与预先配置的配置信息进行比较,在配置信息中该车辆型号下存在与车控对象匹配的配置对象,且配置对象支持语音控制的情况下,即可以确定控制指令,利用该控制指令对车机的配置对象进行语音控制。在本公开提供的技术方案中预先存储配置信息,一套配置信息可以适配多款车型,从而实现为每款车型快速适配语音功能,无需人工针对不同车辆型号进行不同的配置,配置效率较高,用时较短,人工成本较低,准确性较高。
在一些实施例中,所述方法还包括:
步骤S17,响应于所述配置信息中所述车辆型号存在与所述车控对象匹配的配置对象、且所述配置对象不支持语音控制,确定所述配置对象对应的界面信息。
步骤S18,响应于所述界面信息表明所述配置对象存在控制界面,确定界面跳转指令。
步骤S19,响应于所述界面跳转指令,控制车机跳转所述控制界面。
其中,界面信息用于表明配置对象是否存在控制界面,控制界面是指在车内用于对配置对象进行控制的显示界面。
具体地,在配置信息中该车辆型号存在与车控对象匹配的配置对象时,确定该配置对象是否支持语音控制,在不支持语音控制的情况下,也就是说不能通过语音对该配置对象进行直接控制,此时常常会返回预设的语音信息如“XXX不能通过语音进行控制哦”,而在本实施例中,在不支持语音控制的情况下,确定该配置对象对应的界面信息,在界面信息表明配置对象存在控制界面时,确定界面跳转指令,利用该界面跳转指令,控制车机跳转到该控制界面,用户可以通过跳转后的控制界面对配置对象进行控制,为用户提供便利。
在一些实施例中,所述控制车机跳转所述控制界面的步骤后,所述方法还包括:
步骤S20,获取所述控制界面中操作按钮对应的文字信息;
步骤S21,响应于接收到的第二语音请求与所述文字信息中的目标信息匹配,对所述目标信息对应的目标操作按钮执行虚拟点击操作。
其中,操作按钮是控制界面中用于对配置界面进行控制的按钮,如加大或减小,获取控制界面中操作按钮对应的文字信息,响应于接收到的第二语音请求,即用户再次说话的内容,在第二语音请求与文字信息中的目标信息匹配时,如第二语音请求为加大,与控制界面中加大按钮相对应,则可以对目标信息对应的目标操作按钮执行虚拟点击操作,如虚拟点击加大按钮,从而实现利用语音实现目标操作按钮,为用户提供便利。
在一些实施例中,所述方法还包括:
步骤S22,响应于所述界面信息表明所述配置对象不存在控制界面,确定第一语音信息;
步骤S23,控制车机播放所述第一语音信息。
具体地,在配置对象不支持语音控制的情况下,进一步确定该配置对象对应的界面信息,在界面信息表明配置对象不存在控制界面时,确定第一语音信息,如“语音还不支持控制,请手动操作吧”。在本实施例中,在配置对象既不支持语音控制,又不存在控制界面的情况下,确定出向用户进行反馈的兜底语音信息,使得用户及时了解语音控制进程。
举例来说,在倒车视频影像不支持语音控制的情况下,若第一语音请求的语音内容为“打开倒车视频影像”,确定出配置对象为倒车视频影像,因倒车视频影像不支持语音控制,因此确定倒车视频影像是否存在控制界面,如存在控制界面,则生成界面跳转指令,控制车机跳转倒车视频影像的控制界面,若不存在控制界面,则生成第一语音信息,播放该第一语音信息。
在一种可能的实现方式中,如图2所示,云端服务器包括网关中控、控制类服务、语音学堂和能力服务,控制类服务包括车辆控制和***控制。其中,网关中控用于对接收到的所有请求向控制类服务发起请求;控制类服务中任意一个命中后,会向能力服务或语音学堂发起调用的查询。语音学堂查询知识库服务,若有指令相关的,直接返回给控制技能,如果没有指令相关的,则会向能力服务发起调用。能力服务根据配置定义,可能会回调控制类服务指令返回给语音学堂。
具体地,如图3所示,用户发起请求:“怎么打开天幕”,的第一语音请求,网关中控接收该第一语音请求(图3中1),用于向控制类服务发起请求,若命中车辆控制服务(图3中1.1),表明第一语音请求对应的语义识别结果属于车控垂域,车辆控制服务在第一语音请求对应的语义识别结果中处理疑问词相关语义(图3中1.1.1),若存在预设疑问词语义,进入学堂结果查询(图3中1.1.12),利用语音学堂查询知识库服务,确定车控对象,若在车型配置表存储在知识库时,根据该知识库进一步确定车控对象在车型配置表是否有配置对象,在存在匹配的配置对象的情况下,确定配置对象是否支持语音控制,根据是否支持语音控制,确定是否有指令,根据是否有指令决定是否请求能力(图3中1.1.2.1),若支持语音控制,则会存在控制指令相关内容,即可以直接返回控制指令,若不支持语音控制,则没有指令相关的,则向能力服务请求指令定义,能力服务根据配置决定是否请求回调***控制界面(图3中1.1.2.2.1),若存在控制界面,则请求***控制界面指令(图3中1.1.2.2.2),***控制服务处理标准话术指令(图3中1.1.2.2.2.1),并返回界面指令结果即界面跳转指令(图3中1.1.2.2.2.2,),并将最终结果返回客户端即车机。
在一些实施例中,所述方法还包括:
步骤S24,响应于所述配置信息中所述车辆型号不存在与所述车控对象匹配的配置对象,确定第二语音信息;
步骤S25,控制车机播放所述第二语音信息。
在本实施例中,在配置信息中车辆型号不存在与车控对象匹配的配置对象时,确定第二语音信息,如“我没有你说的这个哦”,并控制车机播放第二语音信息,以使得用户及时了解语音控制进程,并根据第二语音信息对车辆有进一步的了解,有利于用户后续的语音控制。
在一种可能的应用场景中,预先设置车型配置表,将该车型配置表存储在云端服务器,云端服务器在接收到第一语音请求后,根据车型配置表确定第一语音请求对应的车辆型号是否有匹配的配置对象,若无配置对象,则播报“我还没有你说的这个”;若有配置对象,进一步配置对象是否支持语音控制,若支持语音控制,则生成控制指令,对车机进行语音控制;若不支持语音控制,则判断配置对象是否有控制界面,有控制界面,则生成界面跳转指令,控制车机跳转到配置对象的控制界面,便利用户对配置对象进行控制;若没有控制界面,则语音播报“语音还不支持控制,请手动操作吧”。
示例性装置
基于与本公开方法实施例相同的构思,如图4所示,本公开实施例还提供了一种语音控制装置,具体包括如下模块:
请求处理模块41,被配置为响应于接收到的第一语音请求,确定所述第一语音请求对应的车辆型号以及车控对象;
指令确定模块42,被配置为响应于配置信息中所述车辆型号存在与所述车控对象匹配的配置对象、且所述配置对象支持语音控制,确定控制指令;
控制处理模块43,被配置为响应于所述控制指令,对车机进行语音控制。
在一些实施例中,所述装置还包括:
界面确定模块,被配置为响应于所述配置信息中所述车辆型号存在与所述车控对象匹配的配置对象、且所述配置对象不支持语音控制,确定所述配置对象对应的界面信息;
跳转确定模块,被配置为响应于所述界面信息表明所述配置对象存在控制界面,确定界面跳转指令;
跳转控制模块,被配置为响应于所述界面跳转指令,控制车机跳转所述控制界面。
在一些实施例中,所述装置还包括:
第一语音确定模块,被配置为响应于所述界面信息表明所述配置对象不存在控制界面,确定第一语音信息;
第一语音播放模块,被配置为控制车机播放所述第一语音信息。
在一些实施例中,所述装置还包括:
文字获取模块,被配置为获取所述控制界面中操作按钮对应的文字信息;
虚拟操作模块,被配置为响应于接收到的第二语音请求与所述文字信息中的目标信息匹配,对所述目标信息对应的目标操作按钮执行虚拟点击操作。
在一些实施例中,所述装置还包括:
第一对象确定模块,被配置为响应于所述配置信息中所述车辆型号存在所述车控对象,所述配置信息中所述车辆型号存在与所述车控对象匹配的配置对象;
第二对象确定模块,被配置为响应于所述配置信息中所述车辆型号不存在所述车控对象,确定与所述车控对象存在对应关系的转化控制对象;
第三对象确定模块,被配置为响应于所述配置信息中所述车辆型号存在所述转化控制对象,所述配置信息中所述车辆型号存在与所述车控对象匹配的配置对象。
在一些实施例中,所述装置还包括:
第二语音确定模块,被配置为响应于所述配置信息中所述车辆型号不存在与所述车控对象匹配的配置对象,确定第二语音信息;
第二语音播放模块,被配置为控制车机播放所述第二语音信息。
在一些实施例中,所述请求处理模块,包括:
语义识别单元,被配置为确定所述第一语音请求对应的语义识别结果;
对象确定单元,被配置为响应于所述语义识别结果属于车控垂域,确定所述语义识别结果对应的车控对象。
在一些实施例中,所述对象确定单元,包括:
查询处理子单单元,被配置为响应于所述语义识别结果属于车控垂域、且所述语义识别结果包括预设疑问词语义,调用预先存储的知识库进行查询,确定所述语义识别结果对应的车控对象;
对象提取子单元,被配置为响应于所述语义识别结果属于车控垂域、且所述语义识别结果不包括预设疑问词语义,在所述语义识别结果中提取出车控对象。
示例性电子设备
图5图示了根据本公开实施例的电子设备的框图。
如图5所示,电子设备50包括一个或多个处理器51和存储器52。
处理器51可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备50中的其他组件以执行期望的功能。
存储器52可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器51可以运行所述程序指令,以实现上文所述的本公开的各个实施例的语音控制方法以及/或者其他期望的功能。
在一个示例中,电子设备50还可以包括:输入装置53和输出装置54,这些组件通过总线***和/或其他形式的连接机构(未示出)互连。
当然,为了简化,图5中仅示出了该电子设备50中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备50还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的语音控制方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在车主计算设备上执行、部分地在车主设备上执行、作为一个独立的软件包执行、部分在车主计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的语音控制方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述发明的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本公开中涉及的器件、装置、设备、***的方框图仅作为示例性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所发明的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此发明的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此发明的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (11)

1.一种语音控制方法,其特征在于,具体包括如下步骤:
响应于接收到的第一语音请求,确定所述第一语音请求对应的车辆型号以及车控对象;
响应于配置信息中所述车辆型号存在与所述车控对象匹配的配置对象、且所述配置对象支持语音控制,确定控制指令;
响应于所述控制指令,对车机进行语音控制。
2.根据权利要求1所述的方法,所述方法还包括:
响应于所述配置信息中所述车辆型号存在与所述车控对象匹配的配置对象、且所述配置对象不支持语音控制,确定所述配置对象对应的界面信息;
响应于所述界面信息表明所述配置对象存在控制界面,确定界面跳转指令;
响应于所述界面跳转指令,控制车机跳转所述控制界面。
3.根据权利要求2所述的方法,所述方法还包括:
响应于所述界面信息表明所述配置对象不存在控制界面,确定第一语音信息;
控制车机播放所述第一语音信息。
4.根据权利要求2所述的方法,所述控制车机跳转所述控制界面的步骤后,所述方法还包括:
获取所述控制界面中操作按钮对应的文字信息;
响应于接收到的第二语音请求与所述文字信息中的目标信息匹配,对所述目标信息对应的目标操作按钮执行虚拟点击操作。
5.根据权利要求1所述的方法,所述响应于配置信息中所述车辆型号存在与所述车控对象匹配的配置对象的步骤前,所述方法还包括:
响应于所述配置信息中所述车辆型号存在所述车控对象,所述配置信息中所述车辆型号存在与所述车控对象匹配的配置对象;
响应于所述配置信息中所述车辆型号不存在所述车控对象,确定与所述车控对象存在对应关系的转化控制对象;
响应于所述配置信息中所述车辆型号存在所述转化控制对象,所述配置信息中所述车辆型号存在与所述车控对象匹配的配置对象。
6.根据权利要求1所述的方法,所述方法还包括:
响应于所述配置信息中所述车辆型号不存在与所述车控对象匹配的配置对象,确定第二语音信息;
控制车机播放所述第二语音信息。
7.根据权利要求1所述的方法,所述确定所述第一语音请求对应的车控对象,包括:
确定所述第一语音请求对应的语义识别结果;
响应于所述语义识别结果属于车控垂域,确定所述语义识别结果对应的车控对象。
8.根据权利要求7所述的方法,所述响应于所述语义识别结果属于车控垂域,确定所述语义识别结果对应的车控对象,包括:
响应于所述语义识别结果属于车控垂域、且所述语义识别结果包括预设疑问词语义,调用预先存储的知识库进行查询,确定所述语义识别结果对应的车控对象;
响应于所述语义识别结果属于车控垂域、且所述语义识别结果不包括预设疑问词语义,在所述语义识别结果中提取出车控对象。
9.一种语音控制装置,其特征在于,具体包括如下模块:
请求处理模块,被配置为响应于接收到的第一语音请求,确定所述第一语音请求对应的车辆型号以及车控对象;
指令确定模块,被配置为响应于配置信息中所述车辆型号存在与所述车控对象匹配的配置对象、且所述配置对象支持语音控制,确定控制指令;
控制处理模块,被配置为响应于所述控制指令,对车机进行语音控制。
10.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-8任一项所述的语音控制方法。
11.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-8任一项所述的语音控制方法。
CN202211096441.7A 2022-09-08 2022-09-08 语音控制方法、装置、存储介质及电子设备 Pending CN117672210A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211096441.7A CN117672210A (zh) 2022-09-08 2022-09-08 语音控制方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211096441.7A CN117672210A (zh) 2022-09-08 2022-09-08 语音控制方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN117672210A true CN117672210A (zh) 2024-03-08

Family

ID=90079613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211096441.7A Pending CN117672210A (zh) 2022-09-08 2022-09-08 语音控制方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN117672210A (zh)

Similar Documents

Publication Publication Date Title
CN108831469B (zh) 语音命令定制方法、装置和设备及计算机存储介质
CN111447123B (zh) 一种智慧家居的配置方法、装置、电子设备及介质
CN109326289B (zh) 免唤醒语音交互方法、装置、设备及存储介质
CN107276864B (zh) 智能语音设备控制家电的方法、装置及***
US11869487B1 (en) Allocation of local and remote resources for speech processing
US9953648B2 (en) Electronic device and method for controlling the same
CN107591155B (zh) 语音识别方法及装置、终端及计算机可读存储介质
CN109360563B (zh) 一种语音控制方法、装置、存储介质及空调
CN109584876A (zh) 语音数据的处理方法、装置和语音空调
CN110851221A (zh) 一种智慧家居场景配置的方法及装置
CN109215638B (zh) 一种语音学习方法、装置、语音设备及存储介质
CN110932953A (zh) 智能家居控制方法、装置、计算机设备及存储介质
CN110767232A (zh) 语音识别控制方法及装置、计算机设备和计算机存储介质
CN110767219B (zh) 语义更新方法、装置、服务器和存储介质
CN111933135A (zh) 终端控制方法、装置、智能终端及计算机可读存储介质
CN117672210A (zh) 语音控制方法、装置、存储介质及电子设备
CN110956961A (zh) 智能语音***及利用智能语音***控制投影机的方法
CN112700770A (zh) 语音控制方法、音箱设备、计算设备和存储介质
CN113314115A (zh) 终端设备的语音处理方法、终端设备及可读存储介质
CN111627417B (zh) 播放语音的方法、装置及电子设备
CN113990312A (zh) 一种设备控制方法及装置、电子设备及存储介质
CN115484040A (zh) 家电设备的声纹注册方法、终端设备、家电设备及介质
JP2003131695A (ja) 音声認識機器、音声認識機器制御装置、及び音声認識機器制御方法
CN111640422A (zh) 语音人声分离方法、装置、终端及存储介质
CN114179083B (zh) 一种引领机器人语音信息的生成方法、装置和引领机器人

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination