CN112581955B - 语音控制方法、服务器、语音控制***和可读存储介质 - Google Patents

语音控制方法、服务器、语音控制***和可读存储介质 Download PDF

Info

Publication number
CN112581955B
CN112581955B CN202011380283.9A CN202011380283A CN112581955B CN 112581955 B CN112581955 B CN 112581955B CN 202011380283 A CN202011380283 A CN 202011380283A CN 112581955 B CN112581955 B CN 112581955B
Authority
CN
China
Prior art keywords
information
template
voice
control
round
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011380283.9A
Other languages
English (en)
Other versions
CN112581955A (zh
Inventor
赵耀
易晖
申众
翁志伟
张又亮
张崇宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Xiaopeng Motors Technology Co Ltd
Guangzhou Chengxingzhidong Automotive Technology Co., Ltd
Original Assignee
Guangzhou Xiaopeng Motors Technology Co Ltd
Guangzhou Chengxingzhidong Automotive Technology Co., Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Xiaopeng Motors Technology Co Ltd, Guangzhou Chengxingzhidong Automotive Technology Co., Ltd filed Critical Guangzhou Xiaopeng Motors Technology Co Ltd
Priority to CN202011380283.9A priority Critical patent/CN112581955B/zh
Publication of CN112581955A publication Critical patent/CN112581955A/zh
Application granted granted Critical
Publication of CN112581955B publication Critical patent/CN112581955B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种语音控制方法、服务器、语音控制***和可读存储介质。语音控制方法包括:获取第n轮语音信息,根据第n轮语音信息和预设的知识图谱确定第一改写模板,n为自然数;获取第n+1轮语音信息,根据第n+1轮语音信息和知识图谱确定第二改写模板;根据第一改写模板和第二改写模板,生成对应第n+1轮语音信息的应答信息;根据第n轮语音信息和第n+1轮语音信息,对车辆发出相应的控制指令。上述语音控制方法中,在用户通过多轮会话的方式发出语音指令时,可根据先前会话的相关信息,对后续会话进行相应的改写,并生成相应的应答信息,可提高语音控制的准确度,使得语音会话具有流畅性。

Description

语音控制方法、服务器、语音控制***和可读存储介质
技术领域
本发明涉及智能语音控制领域,特别涉及一种语音控制方法、服务器、语音控制***和可读存储介质。
背景技术
在相关技术中,可通过车载交互***进行任务型对话来相应地控制车辆***。由于全车控制涉及众多车辆控件,而且在多轮对话中用户往往会省略先前对话中的相关信息,使得交互***不能明确当前对话所对应的控制信息,造成多轮对话的流畅性不足。
发明内容
本发明的实施方式提供了一种语音控制方法、服务器、语音控制***和可读存储介质。
本发明实施方式提供的一种语音控制方法,用于控制车辆,所述语音控制方法包括:
获取第n轮语音信息,根据所述第n轮语音信息和预设的知识图谱确定第一改写模板,n为自然数;
获取第n+1轮语音信息,根据所述第n+1轮语音信息和所述知识图谱确定第二改写模板;
根据所述第一改写模板和所述第二改写模板,生成对应所述第n+1轮语音信息的应答信息;
根据所述第n轮语音信息和所述第n+1轮语音信息,对所述车辆发出相应的控制指令。
上述语音控制方法中,在用户通过多轮会话的方式发出语音指令时,可根据先前会话的相关信息,对后续会话进行相应的改写,并生成相应的应答信息,可提高语音控制的准确度,使得语音会话具有流畅性。
在某些实施方式中,所述语音控制方法包括:
获取所述车辆的控件的实体信息及所述控件的模式信息;
根据所述实体信息和所述模式信息确定对应关系;
根据所述模式信息生成对应所述实体信息的模板片段;
根据所述实体信息、所述模式信息、所述对应关系和所述模板片段,建立所述知识图谱。
在某些实施方式中,所述车辆包括对应所述第n轮语音信息的第一控件,
获取第n轮语音信息,根据所述第n轮语音信息和预设的知识图谱确定第一改写模板,包括:
根据所述第n轮语音信息确定第一文本信息,所述第一文本信息包括所述第一控件的实体信息;
根据所述知识图谱和所述第一控件的实体信息,确定对应所述第一文本信息的模板片段,生成第一模式模板;
根据所述第一文本信息和所述第一模式模板,生成所述第一改写模板。
在某些实施方式中,所述实体信息包括控件信息、动作信息和属性信息,所述模式信息包括控件类信息、动作类信息和属性类信息,
根据所述第一文本信息和所述第一模式模板,生成所述第一改写模板,包括:
将所述第一模式模板中的控件类信息替换为所述第一控件的控件信息,和/或
将所述第一模式模板中的动作类信息替换为所述第一控件的动作信息,和/或
将所述第一模式模板中的属性类信息替换为所述第一控件的属性信息。
在某些实施方式中,所述车辆包括对应所述第n+1轮语音信息的第二控件,
获取第n+1轮语音信息,根据所述第n+1轮语音信息和所述知识图谱确定第二改写模板,包括:
根据所述第n+1轮语音信息确定第二文本信息,所述第二文本信息包括所述第二控件的实体信息和匹配信息;
根据所述知识图谱、所述第二控件的实体信息和匹配信息,确定对应所述第二文本信息的模板片段,生成第二模式模板;
根据所述第二文本信息和所述第二模式模板,生成所述第二改写模板。
在某些实施方式中,所述实体信息包括控件信息、动作信息和属性信息,所述模式信息包括控件类信息、动作类信息和属性类信息,
根据所述第二文本信息和所述第二模式模板,生成所述第二改写模板,包括:
将所述第二模式模板中的控件类信息替换为所述第二控件的控件信息,和/或
将所述第二模式模板中的动作类信息替换为所述第二控件的动作信息,和/或
将所述第二模式模板中的属性类信息替换为所述第二控件的属性信息。
在某些实施方式中,根据所述第一改写模板和所述第二改写模板,生成对应所述第n+1轮语音信息的应答信息,包括:
对所述第二改写模板和所述第一改写模板进行匹配,移除所述第二改写模板中的匹配信息,并确定所述第二改写模板中的缺失部分;
根据所述第一改写模板,生成待填充片段;
将所述待填充片段对所述缺失部分进行填充;
在检测到所述缺失部分被填充完全的情况下,生成实体模板和对应的所述应答信息。
在某些实施方式中,所述语音控制方法包括:
在检测到所述缺失部分未被填充完全的情况下,取消对所述缺失部分的填充。
在某些实施方式中,所述语音控制方法包括:
根据所述实体模板中的实体信息,对所述第二控件发出相应的控制指令。
本发明实施方式提供的一种服务器,用于控制车辆,所述服务器包括控制模块和语音获取模块,所述语音获取模块用于获取第n轮语音信息和第n+1轮语音信息,
所述控制模块用于根据所述第n轮语音信息和预设的知识图谱确定第一改写模板,n为自然数;及
用于根据所述第n+1轮语音信息和所述知识图谱确定第二改写模板;及
用于根据所述第一改写模板和所述第二改写模板,生成对应所述第n+1轮语音信息的应答信息;及
用于根据所述第n轮语音信息和所述第n+1轮语音信息,对所述车辆发出相应的控制指令。
上述服务器中,在用户通过多轮会话的方式发出语音指令时,可根据先前会话的相关信息,对后续会话进行相应的改写,并生成相应的应答信息,可提高语音控制的准确度,使得语音会话具有流畅性。
本发明实施方式提供的一种语音控制***,包括:
车辆,用于采集第n轮语音信息和第n+1轮语音信息;
服务器,用于获取所述第n轮语音信息,根据所述第n轮语音信息和预设的知识图谱确定第一改写模板,n为自然数;及
用于获取所述第n+1轮语音信息,根据所述第n+1轮语音信息和所述知识图谱确定第二改写模板;及
用于根据所述第一改写模板和所述第二改写模板,生成对应所述第n+1轮语音信息的应答信息;及
用于根据所述第n轮语音信息和所述第n+1轮语音信息,对所述车辆发出相应的控制指令。
上述语音控制***中,在用户通过多轮会话的方式发出语音指令时,可根据先前会话的相关信息,对后续会话进行相应的改写,并生成相应的应答信息,可提高语音控制的准确度,使得语音会话具有流畅性。
在某些实施方式中,所述车辆还用于提示所述应答信息。
本发明实施方式提供的一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,实现上述任一实施方式所述的语音控制方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1是本发明实施方式的语音控制方法的流程图;
图2是本发明实施方式的语音控制***的模块图;
图3是本发明实施方式的语音控制方法的另一流程图;
图4是本发明实施方式的知识图谱的示意图;
图5是本发明实施方式的知识图谱的另一示意图;
图6是本发明实施方式的语音控制方法的又一流程图;
图7是本发明实施方式的语音控制方法的再一流程图;
图8是本发明实施方式的语音控制方法的再一流程图;
图9是本发明实施方式的语音控制***的示意图。
主要元件符号说明:
语音控制***100;
车辆10、提示件11;
服务器20、控制模块21、语音获取模块23。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接。可以是机械连接,也可以是电连接。可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明的公开提供了许多不同的实施方式或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本发明。此外,本发明可以在不同例子中重复参考数字和/或参考字母,这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施方式和/或设置之间的关系。此外,本发明提供了的各种特定的工艺和材料的例子,但是本领域普通技术人员可以意识到其他工艺的应用和/或其他材料的使用。
请参考图1和图2,本发明实施方式提供的一种语音控制方法,用于车辆10,语音控制方法包括:
步骤S110:获取第n轮语音信息,根据第n轮语音信息和预设的知识图谱确定第一改写模板,n为自然数;
步骤S130:获取第n+1轮语音信息,根据第n+1轮语音信息和知识图谱确定第二改写模板;
步骤S150:根据第一改写模板和第二改写模板,生成对应第n+1轮语音信息的应答信息;
步骤S170:根据第n轮语音信息和第n+1轮语音信息,对车辆10发出相应的控制指令。
本发明实施方式的语音控制方法可通过本发明实施方式的服务器20实现。请结合图2,服务器20用于控制车辆10。服务器20包括控制模块21和语音获取模块23。语音获取模块23用于获取第n轮语音信息和第n+1轮语音信息。控制模块21用于根据第n轮语音信息和预设的知识图谱确定第一改写模板,n为自然数;及用于根据第n+1轮语音信息和知识图谱确定第二改写模板;及用于根据第一改写模板和第二改写模板,生成对应第n+1轮语音信息的应答信息;及用于根据第n轮语音信息和第n+1轮语音信息,对车辆10发出相应的控制指令。
上述语音控制方法和服务器20中,在用户通过多轮会话的方式发出语音指令时,可根据先前会话的相关信息,对后续会话进行相应的改写,并生成相应的应答信息,可提高语音控制的准确度,使得语音会话具有流畅性。
在相关技术中,车辆可通过语音交互的方式识别用户发出的会话,根据会话中的相关信息对车辆上的各类控件进行相应的控制,达到语音控制的效果。在实际应用中,会存在用户需要对车辆上的多个不同控件进行操作或同一个控件进行多次操作的情况,且在进行多轮会话的情况下,用户往往会由于方便而在后续进行的会话中省略部分信息。
针对上述问题,在本发明的一个实施方式中,可通过对会话过程中的多轮会话进行识别,形成第n轮语音信息和第n+1轮语音信息,根据第n轮语音信息和预设的知识图谱来生成包括第n轮语音信息所对应车辆控件的相关信息的第一改写模板,以及根据第n+1轮语音信息和预设的知识图谱来生成包括第n+1轮语音信息所对应车辆10控件的相关信息的第二改写模板,通过第一改写模板和第二改写模板来确定第n+1轮语音信息中被省略的信息,并根据第一改写模板对第二改写模板中被省略的信息进行补充,从而可得到对应第n+1轮语音信息的应答信息,在确定应答信息后,可根据应答信息确定第n+1轮语音信息所对应的控制指令,进而可对车辆10发出对应第n轮语音信息的控制指令,以及发出对应第n+1轮语音信息的控制指令。在其它的实施方式中,可根据第一改写模板和第二改写模板匹配出对应第n+1轮语音信息的应答信息。
综上所述,在进行多轮会话的情况下,通过对当前一轮会话中的相关信息和上一轮会话中的相关信息进行确定,对当前一轮的会话通过信息补充的方式进行改写,从而生成对应的应答信息,可避免由于难以或无法识别出当前一轮的会话所对应的控制指令而发出要求复述会话的问题,从而提高会话的流畅性和语音控制的准确程度。
n为自然数,在一个实施方式中,n可等于0、1、2等等,可理解,第0轮可以理解为整个人机会话的首轮。在另一个实施方式中,n可为不等于0的其它自然数。根据具体情况进行调整。车辆10包括但不限于纯电动车、混合动力车辆、增程式电动车、氢能源车辆、燃油车等。
另外,在图2所示的实施方式中,语音获取模块23设在服务器20,车辆10通过将获取到的语音信息传输至语音获取模块23,使得控制模块21可根据获取到的语音信息来确定相应的改写模板。在其它的实施方式中,语音获取模块23也可以设在车辆10以直接对语音信息进行获取,并通过无线传输的方式发送至服务器,进而使得控制模块21可根据获取到的语音信息来确定相应的改写模板。
请参考图3,在某些实施方式中,语音控制方法包括:
步骤S210:获取车辆的控件的实体信息;
步骤S230:获取控件的模式信息;
步骤S250:根据实体信息和模式信息确定对应关系;
步骤S270:根据模式信息生成对应实体信息的模板片段;
步骤S290:根据实体信息、模式信息、对应关系和模板片段,建立知识图谱。
本发明实施方式的语音控制方法可通过本发明实施方式的服务器20实现。请结合图2,控制模块21用于获取车辆10的控件的实体信息;及用于获取控件的模式信息;及用于根据实体信息和模式信息确定对应关系;及用于根据模式信息生成对应实体信息的模板片段;及用于根据实体信息、模式信息、对应关系和模板片段,对知识图谱进行预设。
如此,可方便根据不同的控件快速生成对应的模板片段。
请结合图4,在图4所示的实施方式中,对应的车辆的控件为车窗,车窗的实体信息包括车窗本体、车窗的具***置、对车窗执行的开关动作、车窗的开启幅度/关闭幅度、对车窗的开启幅度/关闭幅度的调节。模式信息包括对应控件的控件类信息、动作类信息、属性类信息,属性类信息包括控件的位置属性、可调节属性,动作类信息包括对控件的开关动作、调节动作,控件类信息用于确定对应的控件是否为可开关控件或具有位置属性的控件或可调节控件。
在确定车窗的实体信息的情况下,根据具体的语言逻辑,建立车窗的实体信息中的所有信息之间的联系,形成第一对应联系(对应图4的实体信息中各信息之间的带箭头实线)。同样地,在模式信息中建立相关信息之间的联系,形成第二对应联系(对应图4的模式信息中各信息之间的带箭头实线)。根据实体信息和模式信息之间的对应关系(如车窗属于可开关控件),形成第三对应联系(对应图4的实体信息和模式信息之间的带箭头虚线)。根据第一对应联系、第二对应联系和第三对应联系,确定对应关系。
根据模式信息中的第二对应联系,可生成有多个子模式信息。具体地,图4所示的实施方式中包括第一子模式信息、第二子模式信息和第三子模式信息。第一子模式信息包括控件类信息和对控件的开关动作,第二子模式信息包括控件类信息和控件的位置属性,第三子模式信息包括控件类信息、对控件的调节动作和控件的可调节属性。
更具体地,在图4所示的实施方式中,根据第一子模式信息,确定对应实体信息的模板片段可包括“[动作][控件]”、“[控件][动作]”。根据第二子模式信息,确定对应实体信息的模板片段可包括“[属性][控件]”。第三子模式信息,确定对应实体信息的模板片段可包括“[控件][动作][属性值]”、“[动作][控件][属性值]”、“[控件][动作][属性]”、“[动作][控件][属性]”、“[属性][控件][动作][属性值]”、“[动作][控件][属性][属性值]”。
另外,在其它的实施方式中,可根据具体情况增加新的实体信息和模式信息,或对现有的实体信息和模式信息进行调整。
根据实体信息、模式信息、对应关系和模板片段,对知识图谱进行预设,指的是通过实体信息、模式信息、对应关系和模板片段来建立知识图谱,从而可通过知识图谱来直接确定控件的实体信息所对应的模板片段。
可以理解,在实际情况下,可根据具体需求对车辆新增控件,在确定新增的控件所对应的实体信息的情况下,可将新增控件的实体信息对应到知识图谱中的模式信息,从而可建立各控件之间的联系(包括控件特征、控制方式、控制范围等),快速生成关于新增控件的模板片段,达到快捷、高效地对新业务的扩展进行支持。
请结合图4和图5,在图5所示的实施方式中,对应的车辆控件为空调,在确定空调的实体信息的情况下,可快速地在空调的实体信息和模式信息之间建立对应关系,可使得车窗和空调之间形成间接的联系,在进行多轮对话中,即使每轮对话所对应的控件是不同的,也可以根据不同轮次的对话得到相应的控件并生成对应的模板片段。车辆的控件包括但不限于车窗、空调、尾门、灯光、座椅位置。
此外,在其它的实施方式中,知识图谱包括实体层和模式层,实体信息存储在实体层内,模式信息存储在模式层内。
需要指出的是,在其它的实施方式中,步骤S210和步骤S230可以分别独立执行,可以同步执行,也可以依次执行。在一个实施方式中,语音控制方法可以先执行步骤S210,再执行步骤S230,从而可依次获取车辆控件的实体信息和模式信息。
请参考图6,在某些实施方式中,车辆包括对应第n轮语音信息的第一控件。步骤S110,包括:
步骤S111:根据第n轮语音信息确定第一文本信息,第一文本信息包括第一控件的实体信息;
步骤S113:根据知识图谱和第一控件的实体信息,确定对应第一文本信息的模板片段,生成第一模式模板;
步骤S115:根据第一文本信息和第一模式模板,生成第一改写模板。
本发明实施方式的语音控制方法可通过本发明实施方式的服务器20实现。请结合图2,控制模块21用于根据第n轮语音信息确定第一文本信息,第一文本信息包括第一控件的实体信息;及用于根据知识图谱和第一控件的实体信息,确定对应第一文本信息的模板片段,生成第一模式模板;及用于根据第一文本信息和第一模式模板,生成第一改写模板。
如此,可直接确定第n轮语音信息中对应控件的实体信息。
具体地,请结合图5,在这样的一个实施方式中,第n轮语音信息为“副驾车窗开一半”,从而可确定第一文本信息中第一控件的实体信息包括“副驾”、“车窗”、“开启/关闭”、“一半”,进而可通过知识图谱确定对应的模板片段为“[属性][控件][动作][属性值]”并将该模板片段作为第一模式模板,然后根据第一模式模板和第一文本信息,得到的第一改写模板为“[位置:副驾][控件:车窗][动作:调节][属性值:一半]”。其它实施方式的具体原理可参考上述实施方式的原理。第一控件可以为车窗、空调、尾门、灯光、座椅位置的其中一个。
在某些实施方式中,实体信息包括控件信息、动作信息和属性信息,模式信息包括控件类信息、动作类信息和属性类信息。步骤S115,包括:
将第一模式模板中的控件类信息替换为第一控件的控件信息,和/或
将第一模式模板中的动作类信息替换为第一控件的动作信息,和/或
将第一模式模板中的属性类信息替换为第一控件的属性信息。
本发明实施方式的语音控制方法可通过本发明实施方式的服务器20实现。请结合图2,控制模块21用于将第一模式模板中的控件类信息替换为第一控件的控件信息,和/或将第一模式模板中的动作类信息替换为第一控件的动作信息,和/或将第一模式模板中的属性类信息替换为第一控件的属性信息。
如此,可简单得到第一改写模板。
具体地,在一个实施方式中,在通过第一文本信息确定第一控件的控件信息的情况下,将第一模式模板中的控件类信息替换为第一控件的控件信息以生成第一改写模板(如将第一模式模板中的[控件]替换为[车窗])。在另一个实施方式中,在通过第一文本信息确定第一控件的控件信息的情况下,将第一模式模板中的动作类信息替换为第一控件的动作信息以生成第一改写模板(如将第一模式模板中的[控件]替换为[调节])。在又一个实施方式中,在通过第一文本信息确定第一控件的控件信息的情况下,将第一模式模板中的属性类信息替换为第一控件的属性信息以生成第一改写模板(如将第一模式模板中的[控件]替换为[副驾])。其他实施方式的具体原理和上述实施方式的原理类似,在此不再详细展开。
请参考图7,在某些实施方式中,车辆包括对应第n+1轮语音信息的第二控件。步骤S130,包括:
步骤S131:根据第n+1轮语音信息确定第二文本信息,第二文本信息包括第二控件的实体信息和匹配信息;
步骤S133:根据知识图谱、第二控件的实体信息和匹配信息,确定对应第二文本信息的模板片段,生成第二模式模板;
步骤S135:根据第二文本信息和第二模式模板,生成第二改写模板。
本发明实施方式的语音控制方法可通过本发明实施方式的服务器20实现。请结合图2,控制模块21用于根据第n+1轮语音信息确定第二文本信息,第二文本信息包括第二控件的实体信息和匹配信息;及用于根据对应关系、第二控件的实体信息和匹配信息,将对应的至少一个模板片段进行拼接,生成第二模式模板;及用于根据第二文本信息和第二模式模板,生成第二改写模板。
如此,可直接确定第n+1轮语音信息中对应控件的实体信息,实现对于第二控件的业务覆盖和快速落地。
具体地,请结合图5,在这样的一个实施方式中,第n轮语音信息为“副驾车窗开一半”,第n+1轮语音信息为“主驾也是”。根据第n+1轮语音信息可确定第二文本信息中第二控件的实体信息包括“主驾”,以及匹配信息为“也是”,进而可通过知识图谱和匹配信息确定对应的模板片段为“[属性值][相同]”并将该模板片段作为第二模式模板,然后根据第二模式模板和第二文本信息,得到的第二改写模板为“[位置:主副驾][相同]”。第二控件可以为车窗、空调、尾门、灯光、座椅位置的其中一个。
另外,在其它实施方式中,在根据知识图谱、第二控件的实体信息和匹配信息确定有多个对应第二文本信息的模板片段的情况下,可通过具体的语言逻辑对多个对应第二文本信息的模板片段进行融合,从而形成第二模式模板。在一个实施方式中,对应第二文本信息的模板片段为“[属性值][相同]”和“[动作]”,通过拼接的方式融合形成的模板片段为“[属性值][相同][动作]”,并将该模板片段作为第二模式模板。在其它的实施方式中,可通过对应地增加、删除、修改模板片段的方式来得到第二模式模板,在此不再赘述。
在某些实施方式中,实体信息包括控件信息、动作信息和属性信息,模式信息包括控件类信息、动作类信息和属性类信息。步骤S135,包括:
将第二模式模板中的控件类信息替换为第二控件的控件信息,和/或
将第二模式模板中的动作类信息替换为第二控件的动作信息,和/或
将第二模式模板中的属性类信息替换为第二控件的属性信息。
本发明实施方式的语音控制方法可通过本发明实施方式的服务器20实现。请结合图2,控制模块21用于将第二模式模板中的控件类信息替换为第二控件的控件信息,和/或将第二模式模板中的动作类信息替换为第二控件的动作信息,和/或将第二模式模板中的属性类信息替换为第二控件的属性信息。
如此,可简单得到第二改写模板。
具体地,在一个实施方式中,在通过第二文本信息确定第二控件的控件信息的情况下,将第二模式模板中的控件类信息替换为第二控件的控件信息以生成第二改写模板(如将第二模式模板中的[控件]替换为[车窗])。在另一个实施方式中,在通过第二文本信息确定第二控件的控件信息的情况下,将第二模式模板中的动作类信息替换为第二控件的动作信息以生成第二改写模板(如将第二模式模板中的[控件]替换为[调节])。在又一个实施方式中,在通过第二文本信息确定第二控件的控件信息的情况下,将第二模式模板中的属性类信息替换为第二控件的属性信息以生成第二改写模板(如将第二模式模板中的[控件]替换为[主驾])。其他实施方式的具体原理和上述实施方式的原理类似,在此不再详细展开。
请参考图8,在某些实施方式中,步骤S150,包括:
步骤S151:对第二改写模板和第一改写模板进行匹配,移除第二改写模板中的匹配信息,并确定第二改写模板中的缺失部分;
步骤S153:根据第一改写模板,生成待填充片段;
步骤S155:将待填充片段对缺失部分进行填充;
步骤S157:在检测到缺失部分被填充完全的情况下,生成实体模板和对应的应答信息。
本发明实施方式的语音控制方法可通过本发明实施方式的服务器20实现。请结合图2,控制模块21用于对第二改写模板和第一改写模板进行匹配,移除第二改写模板中的匹配信息,并确定第二改写模板中的缺失部分;及用于根据第一改写模板,生成待填充片段;及用于将待填充片段对缺失部分进行填充;及用于在检测到缺失部分被填充完全的情况下,生成实体模板和对应的应答信息。
如此,可实现对第二文本信息的改写,进而可得到对应第n+1轮语音信息的控制指令。
具体地,在这样的一个实施方式中,第一改写模板为“[位置:主驾][控件:空调][动作:调为][属性值:十八度]”,第二改写模板为“[位置:副驾][相同]”,将第二改写模板中的“[相同]”移除,从而可确定第二改写模板中的缺失部分为“[控件][动作][属性值]”。根据第一改写模板,生成“[控件:空调][动作:调为][属性值:十八度]”的待填充片段,并将待填充片段填充至第二改写模板的缺失部分,直至缺失部分被填充完全,从而得到“[位置:副驾][控件:空调][动作:调为][属性值:十八度]”并将其作为实体模板,以及生成相应的的应答信息,应答信息可以为“好的”或“正在将副驾空调调至十八度”。应答信息可根据具体情况进行选择,也可以通过实际测试进行预先设置。
另外,在其它的实施方式中,可通过模板解析来生成实体模板。在一个实施方式中,可采用基于树结构的节点匹配算法实现模板解析。
在某些实施方式中,语音控制方法包括:
在检测到缺失部分未被填充完全的情况下,取消对缺失部分的填充。
本发明实施方式的语音控制方法可通过本发明实施方式的服务器20实现。请结合图2,控制模块21用于在检测到缺失部分未被填充完全的情况下,取消对缺失部分的填充。
如此,可确定会话信息不完全。
具体地,在一个实施方式中,在检测到缺失部分未被填充完全的情况下,可确定存在缺少部分的实体信息,从而停止对缺失部分进行填充,并发出语音提示以对第n轮语音信息和/或第n+1轮语音信息进行再次确认。
在某些实施方式中,语音控制方法包括:
根据实体模板中的实体信息,对第二控件发出相应的控制指令。
本发明实施方式的语音控制方法可通过本发明实施方式的服务器20实现。请结合图2,控制模块21用于根据实体模板中的实体信息,对第二控件发出相应的控制指令。
如此,可在保证对话流畅性的情况下实现对第二控件的相应控制。
具体地,在一个实施方式中,第二控件为位于副驾的空调,实体模板为“[位置:副驾][控件:空调][动作:调为][属性值:十八度]”,从而可对副驾的空调发出控制指令,使得副驾的空调被开启并将温度调整为十八度。
请参考图9,本发明实施方式提供的一种语音控制***100,包括:
车辆10,用于采集第n轮语音信息和第n+1轮语音信息;
服务器20,用于获取第n轮语音信息,根据第n轮语音信息和预设的知识图谱确定第一改写模板,n为自然数;及
用于获取第n+1轮语音信息,根据第n+1轮语音信息和知识图谱确定第二改写模板;及
用于根据第一改写模板和第二改写模板,生成对应第n+1轮语音信息的应答信息;及
用于根据第n轮语音信息和第n+1轮语音信息,对车辆10发出相应的控制指令。
上述语音控制***100中,在用户通过多轮会话的方式发出语音指令时,可根据先前会话的相关信息,对后续会话进行相应的改写,并生成相应的应答信息,可提高语音控制的准确度,使得语音会话具有流畅性。
具体地,知识图谱可存储在服务器20内。在一个实施方式中,在通过车辆10采集到多轮语音信息的情况下,可将多轮语音信息上传至服务器20,使得服务器20对第n轮语音信息和第n+1轮语音信息通过知识图谱分别得到相应的第一改写模板和第二改写模板,进而生成对应第n+1轮语音信息的应答信息。根据第n轮语音信息和第n+1轮语音信息生成相应的控制指令,并将控制指令发送至车辆10,使得车辆10根据控制指令对相应的控件进行控制,使得即使第n+1轮语音信息中存在部分信息缺失,也能通过第n轮语音信息得知第n+1轮语音信息所对应的会话目的,无需向用户对第n+1轮语音信息再次确认,也可以方便用户发出更为简洁、口语化的语音指令,保证了对话的流畅性。在一个实施方式中,服务器20为云端。
另外,在其他的实施方式中,语音控制***100可对第n轮语音信息所对应的改写模板进行存储,从而可方便在相同或类似的对话中直接读取以得到第一改写模板。车辆10包括但不限于纯电动车、混合动力车辆、增程式电动车、氢能源车辆等。
在某些实施方式中,车辆10还用于提示应答信息。如此,可提醒用户已对车辆10按照第n+1轮语音信息进行相应的控制。
具体地,在一些实施方式中,车辆10包括提示件11。在车辆10接收到应答信息后,可通过提示件11向用户提示应答信息。提示件11可以包括蜂鸣器、LED灯、显示屏,应答信息可包括语音、报警提示音、有特定变化规律的灯光、显示屏上的文字。
本发明实施方式提供的一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被处理器执行时,实现上述任一实施方式的语音控制方法。
例如,在计算机程序被执行的情况下,可以实现以下步骤:
步骤S110:获取第n轮语音信息,根据第n轮语音信息和预设的知识图谱确定第一改写模板,n为自然数;
步骤S130:获取第n+1轮语音信息,根据第n+1轮语音信息和知识图谱确定第二改写模板;
步骤S150:根据第一改写模板和第二改写模板,生成对应第n+1轮语音信息的应答信息;
步骤S170:根据第n轮语音信息和第n+1轮语音信息,对车辆发出相应的控制指令。
计算机可读存储介质可设置在车辆,也可设置在服务器等终端,车辆能够与终端进行通信来获取到相应的程序。
可以理解,计算机可读存储介质可以包括:能够携带计算机程序的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、以及软件分发介质等。计算机程序包括计算机程序代码。计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、以及软件分发介质等。
在本发明的某些实施方式中,控制模块可以是一个单片机芯片,集成了处理器、存储器,通讯模块等。处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理模块的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。
在本说明书的描述中,参考术语“一个实施方式”、“一些实施方式”、“某些实施方式”、“示意性实施方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (12)

1.一种语音控制方法,用于控制车辆,其特征在于,所述语音控制方法包括:
获取第n轮语音信息,根据所述第n轮语音信息和预设的知识图谱确定第一改写模板,n为自然数;
获取第n+1轮语音信息,根据所述第n+1轮语音信息和所述知识图谱确定第二改写模板;
根据所述第一改写模板和所述第二改写模板,生成对应所述第n+1轮语音信息的应答信息;
根据所述第n轮语音信息和所述第n+1轮语音信息,对所述车辆发出相应的控制指令;
所述语音控制方法还包括:
获取所述车辆的控件的实体信息及所述控件的模式信息;
根据所述实体信息和所述模式信息确定对应关系;
根据所述模式信息生成对应所述实体信息的模板片段;
根据所述实体信息、所述模式信息、所述对应关系和所述模板片段,建立所述知识图谱。
2.根据权利要求1所述的语音控制方法,其特征在于,所述车辆包括对应所述第n轮语音信息的第一控件,
获取第n轮语音信息,根据所述第n轮语音信息和预设的知识图谱确定第一改写模板,包括:
根据所述第n轮语音信息确定第一文本信息,所述第一文本信息包括所述第一控件的实体信息;
根据所述知识图谱和所述第一控件的实体信息,确定对应所述第一文本信息的模板片段,生成第一模式模板;
根据所述第一文本信息和所述第一模式模板,生成所述第一改写模板。
3.根据权利要求2所述的语音控制方法,其特征在于,所述实体信息包括控件信息、动作信息和属性信息,所述模式信息包括控件类信息、动作类信息和属性类信息,
根据所述第一文本信息和所述第一模式模板,生成所述第一改写模板,包括:
将所述第一模式模板中的控件类信息替换为所述第一控件的控件信息,和/或
将所述第一模式模板中的动作类信息替换为所述第一控件的动作信息,和/或
将所述第一模式模板中的属性类信息替换为所述第一控件的属性信息。
4.根据权利要求2所述的语音控制方法,其特征在于,所述车辆包括对应所述第n+1轮语音信息的第二控件,
获取第n+1轮语音信息,根据所述第n+1轮语音信息和所述知识图谱确定第二改写模板,包括:
根据所述第n+1轮语音信息确定第二文本信息,所述第二文本信息包括所述第二控件的实体信息和匹配信息;
根据所述知识图谱、所述第二控件的实体信息和匹配信息,确定对应所述第二文本信息的模板片段,生成第二模式模板;
根据所述第二文本信息和所述第二模式模板,生成所述第二改写模板。
5.根据权利要求4所述的语音控制方法,其特征在于,所述实体信息包括控件信息、动作信息和属性信息,所述模式信息包括控件类信息、动作类信息和属性类信息,
根据所述第二文本信息和所述第二模式模板,生成所述第二改写模板,包括:
将所述第二模式模板中的控件类信息替换为所述第二控件的控件信息,和/或
将所述第二模式模板中的动作类信息替换为所述第二控件的动作信息,和/或
将所述第二模式模板中的属性类信息替换为所述第二控件的属性信息。
6.根据权利要求4所述的语音控制方法,其特征在于,根据所述第一改写模板和所述第二改写模板,生成对应所述第n+1轮语音信息的应答信息,包括:
对所述第二改写模板和所述第一改写模板进行匹配,移除所述第二改写模板中的匹配信息,并确定所述第二改写模板中的缺失部分;
根据所述第一改写模板,生成待填充片段;
将所述待填充片段对所述缺失部分进行填充;
在检测到所述缺失部分被填充完全的情况下,生成实体模板和对应的所述应答信息。
7.根据权利要求6所述的语音控制方法,其特征在于,所述语音控制方法包括:
在检测到所述缺失部分未被填充完全的情况下,取消对所述缺失部分的填充。
8.根据权利要求6所述的语音控制方法,其特征在于,所述语音控制方法包括:
根据所述实体模板中的实体信息,对所述第二控件发出相应的控制指令。
9.一种服务器,用于控制车辆,其特征在于,所述服务器包括控制模块和语音获取模块,所述语音获取模块用于获取第n轮语音信息和第n+1轮语音信息,
所述控制模块用于根据所述第n轮语音信息和预设的知识图谱确定第一改写模板,n为自然数;及
用于根据所述第n+1轮语音信息和所述知识图谱确定第二改写模板;及
用于根据所述第一改写模板和所述第二改写模板,生成对应所述第n+1轮语音信息的应答信息;及
用于根据所述第n轮语音信息和所述第n+1轮语音信息,对所述车辆发出相应的控制指令;
所述控制模块还用于:
获取所述车辆的控件的实体信息及所述控件的模式信息;
根据所述实体信息和所述模式信息确定对应关系;
根据所述模式信息生成对应所述实体信息的模板片段;
根据所述实体信息、所述模式信息、所述对应关系和所述模板片段,建立所述知识图谱。
10.一种语音控制***,其特征在于,包括:
车辆,用于采集第n轮语音信息和第n+1轮语音信息;
服务器,用于获取所述第n轮语音信息,根据所述第n轮语音信息和预设的知识图谱确定第一改写模板,n为自然数;及
用于获取所述第n+1轮语音信息,根据所述第n+1轮语音信息和所述知识图谱确定第二改写模板;及
用于根据所述第一改写模板和所述第二改写模板,生成对应所述第n+1轮语音信息的应答信息;及
用于根据所述第n轮语音信息和所述第n+1轮语音信息,对所述车辆发出相应的控制指令;
所述服务器还用于:
获取所述车辆的控件的实体信息及所述控件的模式信息;
根据所述实体信息和所述模式信息确定对应关系;
根据所述模式信息生成对应所述实体信息的模板片段;
根据所述实体信息、所述模式信息、所述对应关系和所述模板片段,建立所述知识图谱。
11.根据权利要求10所述的语音控制***,其特征在于,所述车辆还用于提示所述应答信息。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在被处理器执行时,实现权利要求1-8任一项所述的语音控制方法。
CN202011380283.9A 2020-11-30 2020-11-30 语音控制方法、服务器、语音控制***和可读存储介质 Active CN112581955B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011380283.9A CN112581955B (zh) 2020-11-30 2020-11-30 语音控制方法、服务器、语音控制***和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011380283.9A CN112581955B (zh) 2020-11-30 2020-11-30 语音控制方法、服务器、语音控制***和可读存储介质

Publications (2)

Publication Number Publication Date
CN112581955A CN112581955A (zh) 2021-03-30
CN112581955B true CN112581955B (zh) 2024-03-08

Family

ID=75128067

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011380283.9A Active CN112581955B (zh) 2020-11-30 2020-11-30 语音控制方法、服务器、语音控制***和可读存储介质

Country Status (1)

Country Link
CN (1) CN112581955B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113611297A (zh) * 2021-06-25 2021-11-05 北京智芯微电子科技有限公司 一种智能控制方法、装置和智能产品
CN113239178A (zh) * 2021-07-09 2021-08-10 肇庆小鹏新能源投资有限公司 意图生成方法、服务器、语音控制***和可读存储介质
CN113990299B (zh) * 2021-12-24 2022-05-13 广州小鹏汽车科技有限公司 语音交互方法及其装置、服务器和可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105513593A (zh) * 2015-11-24 2016-04-20 南京师范大学 一种语音驱动的智能人机交互方法
CN109033063A (zh) * 2017-06-09 2018-12-18 微软技术许可有限责任公司 基于知识图谱的机器推理
CN109616108A (zh) * 2018-11-29 2019-04-12 北京羽扇智信息科技有限公司 多轮对话交互处理方法、装置、电子设备及存储介质
CN110313153A (zh) * 2017-02-14 2019-10-08 微软技术许可有限责任公司 智能数字助理***
CN111143525A (zh) * 2019-12-17 2020-05-12 广东广信通信服务有限公司 车辆信息获取方法、装置和智能移车***
CN111339246A (zh) * 2020-02-10 2020-06-26 腾讯云计算(北京)有限责任公司 查询语句模板的生成方法、装置、设备及介质
CN111640432A (zh) * 2020-05-27 2020-09-08 北京声智科技有限公司 语音控制方法、装置、电子设备及存储介质
CN111930913A (zh) * 2020-08-14 2020-11-13 上海茂声智能科技有限公司 一种基于知识图谱的问答方法、***、装置、设备及介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105513593A (zh) * 2015-11-24 2016-04-20 南京师范大学 一种语音驱动的智能人机交互方法
CN110313153A (zh) * 2017-02-14 2019-10-08 微软技术许可有限责任公司 智能数字助理***
CN109033063A (zh) * 2017-06-09 2018-12-18 微软技术许可有限责任公司 基于知识图谱的机器推理
CN109616108A (zh) * 2018-11-29 2019-04-12 北京羽扇智信息科技有限公司 多轮对话交互处理方法、装置、电子设备及存储介质
CN111143525A (zh) * 2019-12-17 2020-05-12 广东广信通信服务有限公司 车辆信息获取方法、装置和智能移车***
CN111339246A (zh) * 2020-02-10 2020-06-26 腾讯云计算(北京)有限责任公司 查询语句模板的生成方法、装置、设备及介质
CN111640432A (zh) * 2020-05-27 2020-09-08 北京声智科技有限公司 语音控制方法、装置、电子设备及存储介质
CN111930913A (zh) * 2020-08-14 2020-11-13 上海茂声智能科技有限公司 一种基于知识图谱的问答方法、***、装置、设备及介质

Also Published As

Publication number Publication date
CN112581955A (zh) 2021-03-30

Similar Documents

Publication Publication Date Title
CN112581955B (zh) 语音控制方法、服务器、语音控制***和可读存储介质
KR102322838B1 (ko) 차량내 예측적 고장 검출을 위한 시스템 및 방법
US8964995B2 (en) Acoustic diagnosis and correction system
CN106990948B (zh) 应用升级处理方法和装置
US11260828B2 (en) Method and apparatus for controlling vehicle, and vehicle
CN112634888A (zh) 语音交互方法、服务器、语音交互***和可读存储介质
CA3095590A1 (en) Diagnostic system and method for processing data of a motor vehicle
CN114005449B (zh) 语音交互方法及其装置、模型训练方法、车辆和存储介质
CN115384400A (zh) 车辆的氛围灯控制方法/装置、车辆及存储介质
CN114868113A (zh) 计算机网络节点管理***中的分散式集群联邦
US9826039B2 (en) Configurable communication systems and methods for communication
CN113885959B (zh) 基于接口配置的数据处理方法、装置、设备及介质
EP3806012A1 (en) Identity verification purogram, management apparatus, and method for identity verification
GB2577488A (en) Improvements to system controllers
CN112242909B (zh) 一种管理模板的生成方法、装置、电子设备及存储介质
CN109343874B (zh) 无人车升级方法、装置、设备及计算机可读存储介质
US11924037B2 (en) IoT deployment configuration template
EP3806005A1 (en) Identity verification program, control apparatus, and method for identity verification
CN114299929A (zh) 语音交互方法及装置、服务器及存储介质
KR102064519B1 (ko) 차량 ecu 소프트웨어 업데이트 방법, 그를 수행하기 위한 장치 및 시스템
CN113775415B (zh) 指示灯的驱动状态确定方法和装置
CN108663882A (zh) 光源***及产生具有目标亮度值的合光光束的方法
JP2020150518A (ja) ネットワーク管理システムおよびプログラム
US11902385B2 (en) IoT device reading transformations
CN113163249B (zh) 一种优化推荐码值的方法、装置及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant