CN112151034A - 设备的语音控制方法、装置、电子设备及存储介质 - Google Patents

设备的语音控制方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112151034A
CN112151034A CN202011097639.8A CN202011097639A CN112151034A CN 112151034 A CN112151034 A CN 112151034A CN 202011097639 A CN202011097639 A CN 202011097639A CN 112151034 A CN112151034 A CN 112151034A
Authority
CN
China
Prior art keywords
emotion
target
data
control
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011097639.8A
Other languages
English (en)
Other versions
CN112151034B (zh
Inventor
胡广绪
黄姿荣
魏德平
戴林
赵鹏辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai, Zhuhai Lianyun Technology Co Ltd filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN202011097639.8A priority Critical patent/CN112151034B/zh
Publication of CN112151034A publication Critical patent/CN112151034A/zh
Application granted granted Critical
Publication of CN112151034B publication Critical patent/CN112151034B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Child & Adolescent Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种设备的语音控制方法、装置、电子设备及存储介质。其中,该方法包括:获取目标对象的语音指令,其中,语音指令用于指示目标设备执行的第一操作;从语音指令中提取情感数据,其中,情感数据用于表示目标对象的情感状态;在情感数据表示目标对象处于负面情感状态的情况下,将目标设备的控制话术调整为目标控制话术,其中,目标控制话术用于表示识别出目标对象的语音指令的话术。本申请通过获取用户语音指令,文本解析出语音指令中的代表用户情感的词汇数据,并在获取到用户情绪处于负面情感状态下,及时调整家电设备的控制话术,使得精确识别理解用户意图,提高了用户交互控制体验。

Description

设备的语音控制方法、装置、电子设备及存储介质
技术领域
本申请涉及语音指令处理技术领域,尤其涉及一种设备的语音控制方法、装置、电子设备及存储介质。
背景技术
随着物联网的快速发展,语音交互机制由于具有简单、快捷、交互性好的优点,使得越来越多的设备开始具备语音交互的功能,同时在用户控制家电设备完成一系列操作时,语音控制也逐渐成为人们的首选操作方式。
目前语音交互机制中,存在一些问题:语音交互机制大部分都是基于计算机内存储的已有话术模板对用户询问的问题进行答复,导致用户接收的回复话术少、内容不丰富,不同场景模式下容易出现语义意图歧义的情况,导致用户参与体验比较差。
因此,现有技术中存在已有话术模板回复机制较为单一,不能根据用户发出的交互命令准确理解用户的真正意图的问题。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种设备的语音控制方法、装置、电子设备及存储介质。
根据本申请实施例的一个方面,提供了一种设备的语音控制方法,该所述方法包括:
获取目标对象的语音指令,其中,所述语音指令用于指示目标设备执行的第一操作;
从所述语音指令中提取情感数据,其中,所述情感数据用于表示所述目标对象的情感状态;
在所述情感数据表示所述目标对象处于负面情感状态的情况下,将所述目标设备的控制话术调整为目标控制话术,其中,所述目标控制话术用于表示识别出所述目标对象的语音指令的话术。
可选地,在所述从所述语音指令中提取情感数据之后,所述方法还包括:
从所述语音指令中提取目标交互控制数据,其中,所述交互控制数据用于指示待所述目标设备反馈交互数据的第二操作;
从所述目标交互控制数据中提取所述情感数据。
可选地,从所述语音指令中提取所述目标交互控制数据包括:
在所述语音指令的数量为多个的情况下,从多个所述语音指令中提取相似度大于或者等于相似度阈值的至少两段候选交互控制数据;
在所述候选交互控制数据的出现次数大于或者等于目标次数阈值的情况下,从至少两段所述候选交互控制数据中选取所述目标交互控制数据。
可选地,在将所述目标设备的控制话术调整为所述目标控制话术之前,所述方法还包括:
将所述情感数据与参考情感数据匹配,得到所述情感数据中用于表示负面情感状态的情感子数据,其中,所述参考情感数据用于指示属于所述负面情感状态的负面情感数据;
根据所述情感子数据,确定所述目标对象处于所述负面情感状态。
可选地,在将所述目标设备的控制话术调整为所述目标控制话术之前,所述方法还包括:
将所述情感子数据输入到目标情感分析模型,得到所述情感子数据的负面情感等级,其中,所述负面情感等级用于表示所述目标对象处于所述负面情感状态的程度;
在所述负面情感等级大于或者等于目标等级阈值的情况下,确定调整与所述目标设备对应的所述控制话术。
可选地,在将所述情感子数据输入到所述目标情感分析模型之前,所述方法还包括:
获取训练样本集,其中,所述训练样本集中的训练样本包含训练情感数据、以及用于指示所述训练情感数据的负面情感等级的目标标注信息;
将所述训练情感数据输入初始情感分析模型,得到所述训练情感数据的初始负面情感等级;
根据所述初始负面情感等级与所述目标标注信息调整所述初始情感分析模型的模型参数,得到所述目标情感分析模型。
可选地,将所述目标设备的控制话术调整为所述目标控制话术包括:
调整所述目标设备的控制话术中的多个词语元素的语序,得到所述目标控制话术。
根据本申请实施例的又一方面,提供一种设备的语音控制装置,所述装置包括:
第一获取模块,用于获取目标对象的语音指令,其中,所述语音指令用于指示目标设备执行的第一操作;
第一提取模块,用于从所述语音指令中提取情感数据,其中,所述情感数据用于表示所述目标对象的情感状态;
调整模块,用于在所述情感数据表示所述目标对象处于负面情感状态的情况下,将所述目标设备的控制话术调整为目标控制话术,其中,所述目标控制话术用于表示识别出所述目标对象的语音指令的话术。
可选地,所述装置还包括:
第二提取模块,用于在所述从所述语音指令中提取情感数据之后,从所述语音指令中提取目标交互控制数据,其中,所述交互控制数据用于指示待所述目标设备反馈交互数据的第二操作;
第三提取模块,用于从所述目标交互控制数据中提取所述情感数据。
可选地,第二提取模块包括:
提取单元,用于在所述语音指令的数量为多个的情况下,从多个所述语音指令中提取相似度大于或者等于相似度阈值的至少两段候选交互控制数据;
选取单元,用于在所述候选交互控制数据的出现次数大于或者等于目标次数阈值的情况下,从至少两段所述候选交互控制数据中选取所述目标交互控制数据。
可选地,所述装置还包括:
匹配模块,用于在将所述目标设备的控制话术调整为所述目标控制话术之前,将所述情感数据与参考情感数据匹配,得到所述情感数据中用于表示负面情感状态的情感子数据,其中,所述参考情感数据用于指示属于所述负面情感状态的负面情感数据;
第一确定模块,用于根据所述情感子数据,确定所述目标对象处于所述负面情感状态。
可选地,所述装置还包括:
第一输入模块,用于在将所述目标设备的控制话术调整为所述目标控制话术之前,将所述情感子数据输入到目标情感分析模型,得到所述情感子数据的负面情感等级,其中,所述负面情感等级用于表示所述目标对象处于所述负面情感状态的程度;
第二确定模块,用于在所述负面情感等级大于或者等于目标等级阈值的情况下,确定调整与所述目标设备对应的所述控制话术。
可选地,所述装置还包括:
第二获取模块,用于在将所述情感子数据输入到所述目标情感分析模型之前,获取训练样本集,其中,所述训练样本集中的训练样本包含训练情感数据、以及用于指示所述训练情感数据的负面情感等级的目标标注信息;
第二输入模块,用于将所述训练情感数据输入初始情感分析模型,得到所述训练情感数据的初始负面情感等级;
得到模块,用于根据所述初始负面情感等级与所述目标标注信息调整所述初始情感分析模型的模型参数,得到所述目标情感分析模型。
可选地,调整模块包括:
调整单元,用于调整所述目标设备的控制话术中的多个词语元素的语序,得到所述目标控制话术。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述设备的语音控制方法的步骤。
根据本申请实施例的另一方面,还提供了一种电子装置,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中设备的语音控制方法的步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中设备的语音控制方法的步骤。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
在本申请实施例中,通过获取用户语音指令,文本解析出语音指令中的代表用户情感的词汇数据,并在获取到用户情绪处于负面情感状态下,及时调整家电设备的控制话术,使得精确识别理解用户意图,提高了用户交互控制体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种设备的语音控制方法流程示意图;
图2为本申请实施例提供的一种可选的设备的语音控制整体流程示意图;
图3为本申请实施例提供的一种可选的设备的语音控制装置框图;
图4为本申请实施例提供的一种可选的电子设备装置框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个类似的实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
随着物联网的快速发展,语音交互机制由于简单、快捷、交互性好,目前越来越多的设备采用语音交互,并且逐渐成为人们的首选方式,但是当下存在一个问题:语音交互机制大部分都是基于模板就导致回复话术少、内容不丰富,不同场景模式下出现的语义意图歧义问题,不能识别理解用户的真正意图,用户参与体验比较差。为了解决上述问题,本申请实施例提供一种设备的语音控制方法,如图1所示,该方法包括:
步骤S101,获取目标对象的语音指令,其中,语音指令用于指示目标设备执行的第一操作。
可选地,在本申请实施例中,目标对象向目标设备发出语音指令,该目标设备的服务器获取目标对象的语音指令执行第一操作,这里的目标对象指用户,目标设备指家用电器,第一操作是用户对家用电器发起控制命令,家用电器根据控制命令执行的操作。比如用户向空调发出“将温度调至25摄氏度”的语音指令,空调根据该语音指令执行调整温度至25摄氏度的操作,而这里的调整温度的操作即为第一操作。
故在该场景下,是用户直接控制家用电器执行第一操作,同时,本申请实施例中也可以是用户利用第三方介质来间接控制家用电器,比如,用户利用某智能音箱间接对家用电器进行控制等。
步骤S102,从语音指令中提取情感数据,其中,情感数据用于表示目标对象的情感状态。
可选地,本申请实施例从语音指令的文本中提取代表用户个人情感的数据,其中,情感数据用于表示当前发出语音指令的用户的情感状态,这里的情感状态通常分为三种:积极(正面)、消极(负面)、无关紧要。比如,获取用户的语音指令“立刻打开空调”,提取出“立刻”时,代表当前用户的情感状态属于消极状态,需要快速识别出用户的意图,准确执行指令对应的操作。
步骤S103,在情感数据表示目标对象处于负面情感状态的情况下,将目标设备的控制话术调整为目标控制话术,其中,目标控制话术用于表示识别出目标对象的语音指令的话术。
可选地,在获取到情感数据表示当前用户处于负面情感状态的情况下,说明当前用户的情感状态比较低落,需要快速识别出用户控制家用电器的意图,这时不能再让用户反复表达自己的需求,故需要将目标设备(即当前控制的家用电器)的控制话术调整为能够准确解析出用户意图的目标控制话术。这里的目标控制话术是能够识别出当前用户的语音指令的话术。
需要说明的是,控制话术即用户为实现相应操作所需要采用的具体话术,比如“打开灯”的话术代表将灯打开等。
在本申请实施例中,通过获取用户语音指令,文本解析出语音指令中的代表用户情感的词汇数据,并在获取到用户情绪处于负面情感状态下,及时调整家电设备的控制话术,使得精确识别理解用户意图,提高了用户交互控制体验。
基于上述各实施例的内容,作为一种可选实施例:在从语音指令中提取情感数据之后,该方法还包括:
从语音指令中提取目标交互控制数据,其中,交互控制数据用于指示待目标设备反馈交互数据的第二操作;
从目标交互控制数据中提取情感数据。
可选地,在本申请实施例提供的智能家居场景中,用户和家用电器之间是存在交互控制数据的,其中,交互控制数据用于指示待目标家电设备反馈交互数据的第二操作,也即,在用户向某一家用电器发出语音控制指令后,该家用电器会根据解析出的语音指令结果给予用户一个反馈信息,也即本申请实施例中的第二操作;用户再根据接收的该反馈信息给出相应的答复,这个过程即称为交互过程,那么该交互过程中用户和家用电器之间相互发送的数据即称为交互控制数据。
之后本申请实施例的服务器会根据获取的交互控制数据中提取用户情感数据。
可选地,情感数据还可以包含用户语音交互数据中涉及情感数据出现的次数、交互时间、情感词汇、情感词汇的敏感等级等。本申请实施例可以将该情感数据的所有信息存储在用户情感分析知识图谱中。同时,从用户语音交互数据中提取用户的控制话术以及命令,存储到用户家电控制知识图谱中,该用户家电控制知识图谱中记录用户控制的控制命令、涉及的领域、场景、意图、关联的家电信息等。获取家电设备中传感器得到的当前环境数据和控制运行时的家电信息参数,以及家电设备的属性(功率、用途等),将其存储在家庭设备属性知识图谱内,可参见图2。
本申请实施例通过提取语音交互数据的控制话术以及命令,通过文本解析出涉及的情感数据的词汇,做到精确识别理解用户意图,提高了用户参与体验。
基于上述各实施例的内容,作为一种可选实施例:从语音指令中提取目标交互控制数据包括:
在语音指令的数量为多个的情况下,从多个语音指令中提取相似度大于或者等于相似度阈值的至少两段候选交互控制数据;
在候选交互控制数据的出现次数大于或者等于目标次数阈值的情况下,从至少两段候选交互控制数据中选取目标交互控制数据。
可选地,本申请实施例在语音指令的数量为多个的情况下,从该多个语音指令中提取相似度大于或者等于相似度阈值的至少两段候选交互控制数据,其中,相似度阈值为判断当前至少两段候选交互控制数据为相似交互控制数据的最小值。
然后从至少两段候选交互控制数据中选取出现次数大于等于目标次数阈值的交互控制数据作为目标交互控制数据。例如,从语音指令中提取相似度大于或者等于相似度阈值的相似控制数据,同时选取相似控制数据中出现次数大于等于三次,此时,将出现次数大于等于三次的交互控制数据作为目标交互控制数据。
在这里,本申请实施例某一相似交互控制数据,比如“打开空调”、“空调打开”、“开空调”,出现次数为三次,说明当前空调设备并未准确理解到用户的真实意图,用户满意度较低,此时需要对该交互控制数据进行话术调整。
本申请实施例通过选取相似且多次出现的交互控制数据作为目标交互控制数据,更能有目的性地解决现有技术中无法准确理解用户意图而引起的用户体验差的问题。
基于上述各实施例的内容,作为一种可选实施例:在将目标设备的控制话术调整为目标控制话术之前,该方法还包括:
将情感数据与参考情感数据匹配,得到情感数据中用于表示负面情感状态的情感子数据,其中,参考情感数据用于指示属于负面情感状态的负面情感数据;
根据情感子数据,确定目标对象处于负面情感状态。
可选地,在本申请实施例中提前设置一标准情感话术知识图谱,如图2,该标准情感话术知识图谱中保存有参考情感数据,该参考情感数据用于指示属于负面情感状态的负面情感数据。然后将从目标对象的语音指令中提取的情感数据与参考情感数据作匹配,选取出属于负面情感状态的情感子数据。
基于上述各实施例的内容,作为一种可选实施例:在将目标设备的控制话术调整为目标控制话术之前,该方法还包括:
将情感子数据输入到目标情感分析模型,得到情感子数据的负面情感等级,其中,负面情感等级用于表示目标对象处于负面情感状态的程度;
在负面情感等级大于或者等于目标等级阈值的情况下,确定调整与目标设备对应的控制话术。
可选地,如图2,在确定当前目标对象处于负面情感状态下,需要判断出当前目标对象的负面情感等级是否大于预设的目标等级阈值。在本申请实施例中会将情感子数据输入到训练好的目标情感分析模型内,得到输出的情感子数据的负面情感等级,在负面情感等级大于或者等于目标等级阈值的情况下,确定调整与目标设备对应的控制话术。其中,负面情感等级用于表示目标对象处于负面情感状态的程度。
本申请实施例中通过得到目标对象的负面情感等级,与目标等级阈值进行比较,在大于等于该目标等级阈值的情况下,触发调整目标设备控制话术的机制,使得调整后的目标设备控制话术能够及时理解到目标对像的意图。
基于上述各实施例的内容,作为一种可选实施例:在将情感子数据输入到目标情感分析模型之前,该方法还包括:
获取训练样本集,其中,训练样本集中的训练样本包含训练情感数据、以及用于指示训练情感数据的负面情感等级的目标标注信息;
将训练情感数据输入初始情感分析模型,得到训练情感数据的初始负面情感等级;
根据初始负面情感等级与目标标注信息调整初始情感分析模型的模型参数,得到目标情感分析模型。
可选地,在进行目标情感分析模型训练的过程中,使用大量的标注过的用户语音交互控制数据进行训练,而数据标注的任务往往由产品人员花费大量的人力物力和时间进行完成,本申请实施例为了尽快扩充训练样本数据,使用文本数据增强的技术将极小量的训练样本数据来扩充为大量的训练样本数据。
将上述文本数据增强后的训练情感数据输入初始情感分析模型,得到训练情感数据的初始负面情感等级,根据事先预设好的负面情感等级的目标标注信息,调整初始情感分析模型的模型参数,进而得到目标情感分析模型。
本申请实施例通过利用训练情感数据训练初始情感分析模型,得到的目标情感分析模型能够准确输出用户负面情感等级,之后根据该负面情感等级对目标设备的相关控制话术进行调整。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM(Read-Only Memory,只读存储器)/RAM(Random Access Memory,随机存取存储器)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的设备的语音控制方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述语音控制方法的语音控制装置。图3是根据本申请实施例的一种可选的语音控制装置的示意图,如图3所示,该装置可以包括:
第一获取模块301,用于获取目标对象的语音指令,其中,语音指令用于指示目标设备执行的第一操作;
第一提取模块302,与第一获取模块301相连,用于从语音指令中提取情感数据,其中,情感数据用于表示目标对象的情感状态;
调整模块303,与第一提取模块302相连,用于在情感数据表示目标对象处于负面情感状态的情况下,将目标设备的控制话术调整为目标控制话术,其中,目标控制话术用于表示识别出目标对象的语音指令的话术。
需要说明的是,该实施例中的第一获取模块301可以用于执行上述步骤S201,该实施例中的第一提取模块302可以用于执行上述步骤S202,该实施例中的调整模块303可以用于执行上述步骤S203。
通过上述模块获取用户语音指令,文本解析出语音指令中的代表用户情感的词汇数据,并在获取到用户情绪处于负面情感状态下,及时调整家电设备的控制话术,使得精确识别理解用户意图,提高了用户交互控制体验。
基于上述各实施例的内容,作为一种可选实施例:该装置还包括:
第二提取模块,用于在从语音指令中提取情感数据之后,从语音指令中提取目标交互控制数据,其中,交互控制数据用于指示待目标设备反馈交互数据的第二操作;
第三提取模块,用于从目标交互控制数据中提取情感数据。
基于上述各实施例的内容,作为一种可选实施例:第二提取模块包括:
提取单元,用于在语音指令的数量为多个的情况下,从多个语音指令中提取相似度大于或者等于相似度阈值的至少两段候选交互控制数据;
选取单元,用于在候选交互控制数据的出现次数大于或者等于目标次数阈值的情况下,从至少两段候选交互控制数据中选取目标交互控制数据。
基于上述各实施例的内容,作为一种可选实施例:该装置还包括:
匹配模块,用于在将目标设备的控制话术调整为目标控制话术之前,将情感数据与参考情感数据匹配,得到情感数据中用于表示负面情感状态的情感子数据,其中,参考情感数据用于指示属于负面情感状态的负面情感数据;
第一确定模块,用于根据情感子数据,确定目标对象处于负面情感状态。
基于上述各实施例的内容,作为一种可选实施例:该装置还包括:
第一输入模块,用于在将目标设备的控制话术调整为目标控制话术之前,将情感子数据输入到目标情感分析模型,得到情感子数据的负面情感等级,其中,负面情感等级用于表示目标对象处于负面情感状态的程度;
第二确定模块,用于在负面情感等级大于或者等于目标等级阈值的情况下,确定调整与目标设备对应的控制话术。
基于上述各实施例的内容,作为一种可选实施例:该装置还包括:
第二获取模块,用于在将情感子数据输入到目标情感分析模型之前,获取训练样本集,其中,训练样本集中的训练样本包含训练情感数据、以及用于指示训练情感数据的负面情感等级的目标标注信息;
第二输入模块,用于将训练情感数据输入初始情感分析模型,得到训练情感数据的初始负面情感等级;
得到模块,用于根据初始负面情感等级与目标标注信息调整初始情感分析模型的模型参数,得到目标情感分析模型。
基于上述各实施例的内容,作为一种可选实施例:调整模块包括:
调整单元,用于调整目标设备的控制话术中的多个词语元素的语序,得到目标控制话术。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。
根据本申请实施例的又一个方面,还提供了一种用于实施上述设备的语音控制方法的电子设备,该电子设备可以是服务器、终端、或者其组合。
图4是根据本申请实施例的一种可选的电子设备的结构框图,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401、通信接口402和存储器403通过通信总线404完成相互间的通信,其中,
存储器403,用于存储计算机程序;
处理器401,用于执行存储器403上所存放的计算机程序时,实现如下步骤:
S1,获取目标对象的语音指令,其中,语音指令用于指示目标设备执行的第一操作;
S2,从语音指令中提取情感数据,其中,情感数据用于表示目标对象的情感状态;
S3,在情感数据表示目标对象处于负面情感状态的情况下,将目标设备的控制话术调整为目标控制话术,其中,目标控制话术用于表示识别出目标对象的语音指令的话术。
可选地,在本实施例中,上述的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线、或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括RAM,也可以包括非易失性存储器(non-volatile memory),例如,至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
作为一种示例,如图4所示,上述存储器402中可以但不限于包括上述设备的语音控制装置中的第一获取模块301、第一提取模块302、调整模块303。此外,还可以包括但不限于上述设备的语音控制装置中的其他模块单元,本示例中不再赘述。
上述处理器可以是通用处理器,可以包含但不限于:CPU(Central ProcessingUnit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(DigitalSignal Processing,数字信号处理器)、ASIC(Application Specific IntegratedCircuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
此外,上述电子设备还包括:显示器,用于显示设备的语音控制结果。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图4所示的结构仅为示意,实施上述设备的语音控制方法的设备可以是终端设备,该终端设备可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图4其并不对上述电子设备的结构造成限定。例如,终端设备还可包括比图4中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图4所示的不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
根据本申请实施例的又一个方面,还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行设备的语音控制方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,获取目标对象的语音指令,其中,语音指令用于指示目标设备执行的第一操作;
S2,从语音指令中提取情感数据,其中,情感数据用于表示目标对象的情感状态;
S3,在情感数据表示目标对象处于负面情感状态的情况下,将目标设备的控制话术调整为目标控制话术,其中,目标控制话术用于表示识别出目标对象的语音指令的话术。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例中对此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
根据本申请实施例的又一个方面,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中;计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一个实施例中的设备的语音控制方法步骤。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例设备的语音控制方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例中所提供的方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种设备的语音控制方法,其特征在于,所述方法包括:
获取目标对象的语音指令,其中,所述语音指令用于指示目标设备执行的第一操作;
从所述语音指令中提取情感数据,其中,所述情感数据用于表示所述目标对象的情感状态;
在所述情感数据表示所述目标对象处于负面情感状态的情况下,将所述目标设备的控制话术调整为目标控制话术,其中,所述目标控制话术用于表示识别出所述目标对象的语音指令的话术。
2.根据权利要求1所述的方法,其特征在于,在所述从所述语音指令中提取情感数据之后,所述方法还包括:
从所述语音指令中提取目标交互控制数据,其中,所述交互控制数据用于指示待所述目标设备反馈交互数据的第二操作;
从所述目标交互控制数据中提取所述情感数据。
3.根据权利要求2所述的方法,其特征在于,所述从所述语音指令中提取所述目标交互控制数据包括:
在所述语音指令的数量为多个的情况下,从多个所述语音指令中提取相似度大于或者等于相似度阈值的至少两段候选交互控制数据;
在所述候选交互控制数据的出现次数大于或者等于目标次数阈值的情况下,从至少两段所述候选交互控制数据中选取所述目标交互控制数据。
4.根据权利要求1所述的方法,其特征在于,在将所述目标设备的控制话术调整为所述目标控制话术之前,所述方法还包括:
将所述情感数据与参考情感数据匹配,得到所述情感数据中用于表示负面情感状态的情感子数据,其中,所述参考情感数据用于指示属于所述负面情感状态的负面情感数据;
根据所述情感子数据,确定所述目标对象处于所述负面情感状态。
5.根据权利要求4所述的方法,其特征在于,在将所述目标设备的控制话术调整为所述目标控制话术之前,所述方法还包括:
将所述情感子数据输入到目标情感分析模型,得到所述情感子数据的负面情感等级,其中,所述负面情感等级用于表示所述目标对象处于所述负面情感状态的程度;
在所述负面情感等级大于或者等于目标等级阈值的情况下,确定调整与所述目标设备对应的所述控制话术。
6.根据权利要求5所述的方法,其特征在于,在将所述情感子数据输入到所述目标情感分析模型之前,所述方法还包括:
获取训练样本集,其中,所述训练样本集中的训练样本包含训练情感数据、以及用于指示所述训练情感数据的负面情感等级的目标标注信息;
将所述训练情感数据输入初始情感分析模型,得到所述训练情感数据的初始负面情感等级;
根据所述初始负面情感等级与所述目标标注信息调整所述初始情感分析模型的模型参数,得到所述目标情感分析模型。
7.根据权利要求1至6中任一所述的方法,其特征在于,将所述目标设备的控制话术调整为所述目标控制话术包括:
调整所述目标设备的控制话术中的多个词语元素的语序,得到所述目标控制话术。
8.一种设备的语音控制装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标对象的语音指令,其中,所述语音指令用于指示目标设备执行的第一操作;
第一提取模块,用于从所述语音指令中提取情感数据,其中,所述情感数据用于表示所述目标对象的情感状态;
调整模块,用于在所述情感数据表示所述目标对象处于负面情感状态的情况下,将所述目标设备的控制话术调整为目标控制话术,其中,所述目标控制话术用于表示识别出所述目标对象的语音指令的话术。
9.一种可读计算机存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7中任一项所述设备的语音控制方法步骤。
10.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:
存储器,用于存放计算机程序;
处理器,用于通过运行存储器上所存放的程序来执行权利要求1至7中任一项所述设备的语音控制方法步骤。
CN202011097639.8A 2020-10-14 2020-10-14 设备的语音控制方法、装置、电子设备及存储介质 Active CN112151034B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011097639.8A CN112151034B (zh) 2020-10-14 2020-10-14 设备的语音控制方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011097639.8A CN112151034B (zh) 2020-10-14 2020-10-14 设备的语音控制方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112151034A true CN112151034A (zh) 2020-12-29
CN112151034B CN112151034B (zh) 2022-09-16

Family

ID=73953093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011097639.8A Active CN112151034B (zh) 2020-10-14 2020-10-14 设备的语音控制方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112151034B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113676387A (zh) * 2021-08-11 2021-11-19 追觅创新科技(苏州)有限公司 多足机器人的零位标定方法和装置、存储介质及电子装置
CN115047824A (zh) * 2022-05-30 2022-09-13 青岛海尔科技有限公司 数字孪生多模态设备控制方法、存储介质及电子装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015211403A (ja) * 2014-04-28 2015-11-24 エヌ・ティ・ティ・コミュニケーションズ株式会社 応答システム、応答方法及びコンピュータプログラム
CN105334743A (zh) * 2015-11-18 2016-02-17 深圳创维-Rgb电子有限公司 一种基于情感识别的智能家居控制方法及其***
CN106448652A (zh) * 2016-09-12 2017-02-22 珠海格力电器股份有限公司 空调器的控制方法和装置
CN110085211A (zh) * 2018-01-26 2019-08-02 上海智臻智能网络科技股份有限公司 语音识别交互方法、装置、计算机设备和存储介质
CN111651609A (zh) * 2020-04-24 2020-09-11 中国电力科学研究院有限公司 一种融合知识图谱和情感监督的多轮对话方法及***
CN111696556A (zh) * 2020-07-13 2020-09-22 上海茂声智能科技有限公司 一种分析用户对话情绪方法、***、设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015211403A (ja) * 2014-04-28 2015-11-24 エヌ・ティ・ティ・コミュニケーションズ株式会社 応答システム、応答方法及びコンピュータプログラム
CN105334743A (zh) * 2015-11-18 2016-02-17 深圳创维-Rgb电子有限公司 一种基于情感识别的智能家居控制方法及其***
CN106448652A (zh) * 2016-09-12 2017-02-22 珠海格力电器股份有限公司 空调器的控制方法和装置
CN110085211A (zh) * 2018-01-26 2019-08-02 上海智臻智能网络科技股份有限公司 语音识别交互方法、装置、计算机设备和存储介质
CN111651609A (zh) * 2020-04-24 2020-09-11 中国电力科学研究院有限公司 一种融合知识图谱和情感监督的多轮对话方法及***
CN111696556A (zh) * 2020-07-13 2020-09-22 上海茂声智能科技有限公司 一种分析用户对话情绪方法、***、设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113676387A (zh) * 2021-08-11 2021-11-19 追觅创新科技(苏州)有限公司 多足机器人的零位标定方法和装置、存储介质及电子装置
CN113676387B (zh) * 2021-08-11 2023-02-24 北京小米移动软件有限公司 多足机器人的零位标定方法和装置、存储介质及电子装置
CN115047824A (zh) * 2022-05-30 2022-09-13 青岛海尔科技有限公司 数字孪生多模态设备控制方法、存储介质及电子装置

Also Published As

Publication number Publication date
CN112151034B (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
US10937413B2 (en) Techniques for model training for voice features
EP3291224A1 (en) Method and apparatus for inputting information
CN108810642B (zh) 一种弹幕显示方法、装置及电子设备
CN109299399B (zh) 一种学习内容的推荐方法及终端设备
CN112151034B (zh) 设备的语音控制方法、装置、电子设备及存储介质
CN110288995B (zh) 基于语音识别的交互方法、装置、存储介质和电子设备
CN109165336B (zh) 一种信息输出控制方法及家教设备
CN110704590B (zh) 扩充训练样本的方法和装置
CN110544470B (zh) 语音识别方法、装置、可读存储介质和电子设备
CN108766431B (zh) 一种基于语音识别的自动唤醒方法及电子设备
CN110544473A (zh) 语音交互方法和装置
CN108897517B (zh) 一种信息处理方法及电子设备
CN111343028A (zh) 配网控制方法及装置
TWI674517B (zh) 資訊交互的方法及裝置
CN114626380A (zh) 实体识别的方法和装置、电子设备和存储介质
CN113901837A (zh) 一种意图理解方法、装置、设备及存储介质
CN112233665A (zh) 模型训练的方法和装置、电子设备和存储介质
CN116821290A (zh) 面向多任务对话的大语言模型训练方法和交互方法
CN111128127A (zh) 一种语音识别处理方法及装置
CN117610539A (zh) 意图执行方法、装置、电子设备及存储介质
CN112818096A (zh) 对话生成方法及其装置
CN111144902A (zh) 问卷数据的处理方法和装置、存储介质和电子设备
CN115248843A (zh) 辅助生成笔录的方法、装置和笔录生成***
CN111091821B (zh) 一种基于语音识别的控制方法及终端设备
CN111090383B (zh) 一种指令识别方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant