CN109377995B - 一种控制设备的方法与装置 - Google Patents

一种控制设备的方法与装置 Download PDF

Info

Publication number
CN109377995B
CN109377995B CN201811381967.3A CN201811381967A CN109377995B CN 109377995 B CN109377995 B CN 109377995B CN 201811381967 A CN201811381967 A CN 201811381967A CN 109377995 B CN109377995 B CN 109377995B
Authority
CN
China
Prior art keywords
control command
voice control
mouth shape
voice
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811381967.3A
Other languages
English (en)
Other versions
CN109377995A (zh
Inventor
韩雪
王慧君
毛跃辉
陶梦春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201811381967.3A priority Critical patent/CN109377995B/zh
Publication of CN109377995A publication Critical patent/CN109377995A/zh
Application granted granted Critical
Publication of CN109377995B publication Critical patent/CN109377995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • G10L15/25Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本发明公开了一种控制设备的方法与装置,用于解决现有技术中存在的在控制智能家居设备时,分析得到的语音控制命令的精确度不高的问题。本发明实施例首先将确定的语音控制命令与用户发出针对智能家居设备的语音控制命令的唇语口型信息进行匹配,根据匹配结果确定第一语音控制命令,并根据第一语音控制命令对该智能家居设备进行控制。由于将语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型进行匹配,并根据匹配结果确定控制智能家居设备的语音控制命令,从而能够提高提取语音控制命令的精确度。

Description

一种控制设备的方法与装置
技术领域
本发明涉及无线通信技术领域,特别涉及一种控制设备的方法与装置。
背景技术
智能家居是以住宅为平台,通过物联网技术将家中的各种设备连接到一起,实现智能化的一种生态***。它具有智能灯光控制、智能电器控制、安防监控***、智能背景音乐、智能视频共享、可视对讲***和家庭影院***等功能。
智能家居利用综合布线技术、网络通信技术、安全防范技术、自动控制技术、音视频技术将家居生活有关的设施集成,构建高效的住宅设施与家庭日程事务的管理***,提升家居安全性、便利性、舒适性、艺术性,并实现环保节能的居住环境。
现有的智能家居环境中,目标用户在语音控制职能家具***中的设备时,智能家居***服务器将在采集的包含用于控制语音命令的语音信息中直接分析提取用户的控制语音命令,并根据确定的控制语音命令控制对应的智能家居设备。然而,日常的家居生活中,一户家庭通常配置有多台智能家居设备,一户家庭通常有多位用户,当用户控制智能家居设备时,可能其他用户在控制其他的智能家居设备,也有可能其他用户在交谈,此时服务器采集到的语音信息十分复杂,如果直接进行控制语音命令提取,则会因为噪音的干扰导致分析识别用户控制语音命令的精确度不高。
综上所述,现有在控制智能家居设备时,分析得到的用户控制语音命令的精确度不高。
发明内容
本发明提供一种控制设备的方法和装置,用以解决现有技术中存在的在控制智能家居设备时,分析得到的语音控制命令的精确度不高的问题。
第一方面,本发明实施例提供一种控制设备的方法,该方法包括:
将确定的语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,并根据匹配结果确定第一语音控制命令;
根据所述第一语音控制命令对所述智能家居设备进行控制。
上述方法,首先将确定的语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,根据匹配结果确定第一语音控制命令,并根据第一语音控制命令对该智能家居设备进行控制。由于将语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型进行匹配,并根据匹配结果确定控制智能家居设备的语音控制命令,从而能够提高提取语音控制命令的精确度。
在一种可能的实现方式中,根据下列方式通过下列方式确定所述匹配结果:
判断所述确定的语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度是否小于阈值,若是,则确定所述确定的语音控制命令存在噪音;
否则,确定所述确定的语音控制命令不存在噪音。
上述方法,提供了一种确定语音控制命令中存在噪音的方法,结合唇语口型信息和语音控制命令的匹配度,从而更加精确的判断语音控制命令中是否存在噪音。
在一种可能的实现方式中,所述根据匹配结果确定第一语音控制命令,包括:
若所述确定的语音控制命令存在噪音,则根据所述确定的语音控制命令对应的语音字数信息与所述唇语口型信息确定第一语音控制命令;
若所述确定的语音控制命令不存在噪音,则将所述确定的语音控制命令作为所述第一语音控制命令。
上述方法,给出了根据匹配结果确定第一语音控制命令的方法,如果确定的语音控制命令中不存在噪音,则根据确定的语音控制命令对应的语音字数信息与所述唇语口型信息确定第一语音控制命令,如果确定的语音控制命令不存在噪音,则将该确定的语音控制命令作为第一语音控制命令,从而能够提高解析语音控制命令的精确度。
在一种可能的实现方式中,所述根据所述确定的语音控制命令对应的语音字数信息与所述唇语口型信息确定第一语音控制命令,包括:
若所述确定的语音控制命令对应的语音字数信息大于所述唇语口型对应的口型变换次数信息,则丢弃所述确定的语音控制命令中未匹配到唇语口型信息的语音控制命令,得到第二语音控制命令;
若所述第二语音控制命令对应的语音字数信息大于所述唇语口型信息对应的口型变换次数信息,且所述第二语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度小于阈值,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
上述方法,给出了一种滤除语音控制命令中噪音的方法,将语音控制命令对应的语音数字信息与用户针对该智能家居设备的唇语口型对应的口型变换次数进行比较,丢弃语音控制命令中未匹配到的唇语口型的语音控制命令,再根据替换原则替换无法匹配唇语口型信息的语音控制命令,从而结合唇语口型信息滤除语音控制命令中的噪音,提高解析语音控制命令的精确度。
在一种可能的实现方式中,所述根据所述确定的语音控制命令对应的语音字数信息与所述唇语口型信息确定第一语音控制命令,包括:
若所述确定的语音控制命令对应的语音字数信息不大于所述唇语口型信息对应的口型变换次数信息,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
上述方法,给出了另一种滤除语音控制命令中噪音的方法,如果确定的语音控制命令对应的语音字数信息不大于所述唇语口型信息对应的口型变换次数信息,则根据替换原则替换无法匹配唇语口型信息的语音控制命令,从而结合唇语口型信息滤除语音控制命令中的噪音,提高解析语音控制命令的精确度。
在一种可能的实现方式中,通过下列方式确定所述确定的语音控制命令对应的语音字数信息:
根据语音识别模型对获取到的语音信息进行解析,其中所述语音识别模型是根据语音信息、语音控制命令以及语音字数信息,通过神经网络训练得到的。
上述方法,根据语音识别模型对获取到的语音信息进行解析,这里的语音识别模型根据语音信息、语音控制命令以及语音字数信息,通过神经网络训练得到,从而能够解析语音信息对应的语音控制命令以及语音字数信息。
在一种可能的实现方式中,通过下列方式确定所述唇语口型信息对应的口型变换次数信息以及替换词信息:
根据图像识别模型对所述获取到的唇语口型信息进行解析,其中所述图像识别模型是根据唇语口型信息、口型变换次数信息以及替换词信息,通过神经网络训练得到的。
上述方法,根据图像识别模型对获取到的唇语口型信息进行解析,由于图像识别模型是根据唇语口型信息、口型变换次数信息以及替换词信息,通过神经网络训练得到的,从而对唇语口型信息进行解析时,可以得到该唇语口型信息对应的口型变换次数以及替换词信息。
第二方面,本发明实施例提供一种控制设备的装置,该装置包括:至少一个处理单元及至少一个存储单元,其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行下列过程:
将确定的语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,并根据匹配结果确定第一语音控制命令;
根据所述第一语音控制命令对所述智能家居设备进行控制。
在一种可能的实现方式中,所述处理单元具体用于:
判断所述确定的语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度是否小于阈值,若是,则确定所述确定的语音控制命令存在噪音;
否则,确定所述确定的语音控制命令不存在噪音。
在一种可能的实现方式中,所述处理单元具体用于:
若所述确定的语音控制命令存在噪音,则根据所述确定的语音控制命令对应的语音字数信息与所述唇语口型信息确定第一语音控制命令;
若所述确定的语音控制命令不存在噪音,则将所述确定的语音控制命令作为所述第一语音控制命令。
在一种可能的实现方式中,所述处理单元具体用于:
若所述确定的语音控制命令对应的语音字数信息大于所述唇语口型对应的口型变换次数信息,则丢弃所述确定的语音控制命令中未匹配到唇语口型信息的语音控制命令,得到第二语音控制命令;
若所述第二语音控制命令对应的语音字数信息大于所述唇语口型信息对应的口型变换次数信息,且所述第二语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度小于阈值,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
在一种可能的实现方式中,所述处理单元具体用于:
若所述确定的语音控制命令对应的语音字数信息不大于所述唇语口型信息对应的口型变换次数信息,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
在一种可能的实现方式中,所述处理单元具体用于:
根据语音识别模型对获取到的语音信息进行解析,其中所述语音识别模型是根据语音信息、语音控制命令以及语音字数信息,通过神经网络训练得到的。
在一种可能的实现方式中,所述处理单元具体用于:
根据图像识别模型对所述获取到的唇语口型信息进行解析,其中所述图像识别模型是根据唇语口型信息、口型变换次数信息以及替换词信息,通过神经网络训练得到的。
第三方面,本发明实施例提供一种控制设备的装置,该装置包括:
确定模块:将确定的所述语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,并根据匹配结果确定第一语音控制命;
控制模块:用于根据所述第一语音控制命令对所述智能家居设备进行控制。
第四方面,本发明实施例还提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述方法的步骤。
另外,第二方面至第四方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果,此处不再赘述。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种控制设备的方法流程图;
图2为本发明实施例提供的第一种控制设备的装置结构示意图;
图3为本发明实施例提供的第二种控制设备的装置结构示意图;
图4为本发明实施例提供的一种控制设备的完整方法流程图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
伴随着智能设备的流行,智能家居逐渐进入人们的生活,当用户想用语音控制智能家居时,首先需要将采集到的语音信息进行解析,得到语音控制命令,再根据该语音控制命令对智能家居进行控制。对于采集到的语音信息进行解析时,如果语音信息中只存在用户针对需要控制的智能家居设备的语音信息,则可以根据该语音信息解析出的语音控制命令对智能家居设备进行控制,如果语音信息中除了存在用户针对需要控制的智能家居设备的语音信息外,还存在其他的语音信息,比如其他用户对其他智能家居设备的语音信息、其他用户之间的交谈的语音信息,则对采集到的语音信息进行解析时,可能解析出的语音控制命令不准确,从而会造成通过该语音控制命令对智能家居设备进行错误的控制。
例如,当用户A想打开空调1时,用户A发出“打开空调”的语音信息,而此时用户B想控制空调2进行除湿,用户B发出“除湿”的语音信息,采集语音信息时,将“打开空调”和“除湿”这两个语音都采集到了,则针对空调1,根据采集到的语音信息进行解析时,解析出的语音控制命令为“打开空调,除湿”,此时解析出的语音控制命令为错误的语音控制命令,也可以理解为,解析出的语音控制命令中存在噪音。
如果根据采集到的语音信息解析出的语音控制命令中存在噪音,则需要将语音控制命令中的噪音滤除,再根据滤除后的语音控制命令对智能家居设备进行控制。
本发明实施例中的执行主体可以是服务器;
本发明实施例可以通过麦克风获取语音信息,通过摄像头获取唇语口型信息。
本发明实施例描述的应用场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。
针对上述应用场景,本发明实施例提供一种控制设备的方法,如图1所示,该方法具体包括如下步骤:
步骤100、将确定的语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,并根据匹配结果确定第一语音控制命令;
步骤101、根据第一语音控制命令对所述智能家居设备进行控制。
在本发明实施例中,首先将确定的语音控制命令与用户发出针对该智能家居设备的语音控制命令的唇语口型信息进行匹配,根据匹配结果确定第一语音控制命令,并根据第一语音控制命令对该智能家居设备进行控制。由于确定的语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,并根据匹配结果确定控制智能家居设备的语音控制命令,从而能够提高提取语音控制命令的精确度。
在实施中,在确定语音控制命令之前,如果该智能家居设备的麦克风和摄像头处于休眠状态,则用户需要唤醒该麦克风和摄像头。
唤醒智能家居设备的麦克风和摄像头的方式,可以采用唤醒词进行唤醒,比如,用户发出“空调1”的唤醒词,则与空调1连接的麦克风和摄像头被唤醒;还可以采用遥控唤醒的方式,比如使用遥控器将麦克风和摄像头唤醒。
麦克风和摄像头被唤醒后,麦克风会采集语音信息,摄像头采集用户针对该智能家居设备的唇语口型信息。
需要说明的是,麦克风采集语音信息时,采集的语音信息为麦克风能够识别到的语音信息,比如,用户A发出“打开空调1”的语音信息,用户B发出“除湿”语音信息,如果用户A和用户B的发出的语音信息麦克风都能采集到,则此时麦风的采集的语音信息为“打开空调”“除湿”;
摄像头采集唇语口型信息时,采集的是用户针对需要控制的智能家居设备的唇语口型信息,比如,用户A要控制智能空调1,则用户A需要站在与智能空调1连接的摄像头可视范围内,然后发出语音信息。
下面分别对语音信息解析和唇语口型信息解析进行说明。
麦克风采集到语音信息后,将语音信息发送给服务器,服务器接收到该语音信息后,对该语音信息进行解析。
具体的,对语音信息进行解析时,可以根据语音识别模型对所述获取到的语音信息进行解析,这里的语音识别模型为根据语音信息、语音控制命令以及语音字数信息,通过神经网络训练得到的。
需要说明的是,语音识别模型的构建,需要大量的语音信息,语音控制命令以及语音字数信息,经过神经网络的训练后,得到语音识别模型,将语音信息输入到该语音识别模型中后,会得到与该语音信息对应的语音控制命令以及语音字数信息。
服务器对获取到的语音信息进行解析后,得到与该语音信息对应的语音控制命令以及语音字数信息。
比如,麦克风将采集到的“打开空调1”语音信息发送给服务器,服务器接收到该语音信息后,解析该语音信息,得到与该语音信息对应的控制指令为“打开”,与该语音信息对应的语音字数信息为2。
当服务器对获取到的语音信息进行解析时,还有可能解析失败,比如,与空调连接的麦克风采集到的语音信息为“打开电视机”,此时服务器对该语音信息进行解析时,解析失败,服务器可以向用户推送语音解析失败的消息。
以上是服务器对语音信息的解析,下面对服务器对唇语口型信息进行解析。
摄像头采集到唇语口型信息后,将唇语口型信息发送给服务器,服务器接收到该唇语口型信息后,对唇语口型信息进行解析。
具体的,对唇语口型信息进行解析时,可以根据图像识别模型对所述获取到的唇语口型信息进行解析,这里的图像识别模型为根据唇语口型信息、口型变换次数信息以及替换词信息,通过神经网络训练得到的。
需要说明的是,图像识别模型的构建,需要大量的唇语口型信息、口型变换次数信息以及替换词信息,经过神经网络的训练后,得到图像识别模型,将唇语口型信息输入到该图像识别模型中后,会得到与该唇语口型信息对应的口型变换次数信息以及该唇语口型对应的替换词信息。
服务器对获取到的唇语口型信息进行解析后,得到与该唇语口型信息对应的口型变换次数信息以及替换词信息。
服务器获取到语音信息后,首先将语音信息解析成语音控制命令,如果解析成功,则将解析得到的语音控制命令与获取到的用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,并根据匹配结果确定第一语音控制命令,根据第一语音控制命令对所述智能家居设备进行控制。
在实施中,匹配结果有两种,第一种确定的语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度小于阈值,则确定该确定的语音控制命令存在噪音;
第二种匹配度不小于阈值,则确定该语音控制命令中不存在噪音。
比如,服务器解析出的语音控制命令信息为“打开空调1”,将“打开空调1”的语音控制命令与获取到的用户针对该智能家居设备的唇语口型信息进行匹配时,匹配度为90%,假设阈值为80%,则确定该语音控制命令中不存在噪音;
再比如,服务器解析出的语音控制命令信息为“打开空调1”,将“打开空调1”的语音控制命令与获取到的用户针对该智能家居设备的唇语口型信息进行匹配时,匹配度为70%,假设阈值为80%,则确定该语音控制命令中存在噪音。
如果确定的语音控制命令中不存在噪音,则将该语音控制命令作为第一语音控制命令,也就是根据该语音控制命令控制智能家居设备;
如果确定的语音控制命令中存在噪音,则需要滤除噪音后的语音控制命令对智能家居设备进行控制,根据确定的语音控制命令对应的语音字数信息与所述唇语口型信息滤除噪音,滤除噪音后的语音控制命令作为第一语音控制命令。
本发明实施例中,对存在噪音的语音控制命令滤除噪音时分两种情况,情况一,所述语音控制命令对应的语音字数信息大于所述唇语口型对应的口型变换次数信息,情况二,所述语音控制命令对应的语音字数信息不大于所述唇语口型信息对应的口型变换次数信息,下面分别对这两种情况下滤除语音控制命令中的噪音进行说明。
情况一、语音控制命令对应的语音字数信息大于唇语口型信息对应的口型变换次数信息。
如果语音控制命令对应的语音字数信息大于唇语口型信息对应的口型变换次数信息,则丢弃该语音控制命令中未匹配到唇语口型信息的语音控制命令。
比如,语音控制命令为“打开空调A除湿”,则该语音控制命令对应的语音字数信息为7,如果唇语口型信息对应的口型变换次数为5,则语音字数信息大于语音口型信息,此时需要将语音控制命令与唇语口型信息进行匹配,丢弃语音控制命令中未匹配到唇语口型信息的语音控制命令,假如未匹配到唇语口型信息的语音控制命令为“除湿”,则将语音控制命令“除湿”丢弃,丢弃“除湿”后的语音控制命令为“打开空调A”,则语音控制命令“打开空调A”为滤除噪音后的语音控制命令。
丢弃后的语音控制命令对应的语音字数信息等于唇语口型变换次数信息,则停止丢弃,得到第二语音控制信息,并将第二语音控制信息与所述唇语口型信息进行匹配,如果匹配度不小于阈值,则将该第二语音控制命令作为第一语音控制命令,并根据第一语音控制命令控制智能家居设备;
如果第二语音控制信息与所述唇语口型信息的匹配度小于阈值,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为无法匹配控制命令的唇语口型信息对应的替换词信息得到第一语音控制命令,并根据第一语音控制命令控制智能家居设备。
情况二、所述语音控制命令对应的语音字数信息不大于所述唇语口型信息对应的口型变换次数信息。
如果所述语音控制命令对应的语音字数信息不大于所述唇语口型信息对应的口型变换次数信息,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息。
需要说明的是,替换原则为判断需要替换的语音控制命令和替换词意思是否相近,如果相近则进行替换,如果不相近,则语音解析失败。
下面举例说明当所述语音控制命令对应的语音字数信息等于所述唇语口型信息对应的口型变换次数信息如何滤除语音控制命令中的噪音。
比如,语音控制命令为“打开空调A提高”,则该语音控制命令对应的语音字数信息为7,如果唇语口型信息对应的口型变换次数为7,则语音字数信息等于语音口型信息,此时需要将语音控制命令与唇语口型信息进行匹配,如果语音控制指令“提高”未匹配到唇语口型信息,相应的,也会有一部分唇语口型信息未匹配到语音控制指令,那么将未匹配到语音控制指令的唇语口型信息对应的替换词根据替换原则替换该语音控制指令,比如该替换词为“除湿”,服务器判断“提高”和“除湿”意思不相近,则选择不替换,语音信息解析失败;
未匹配到语音控制指令的唇语口型信息对应的替换词为“调高”,服务器判断“提高”和“调高”意思相近,则选择将“提高”替换为“调高”,替换后的语音控制指令为“打开空调A调高”,也就是滤除噪音后的语音控制指令为“打开空调A调高”。
其中,替换词信息为依据大量的实验结果得到的,并提前存储在服务器中的。
需要说明的是,服务器判断语音控制命令和替换词意思是否相近,可以根据服务器中存储的一些数据进行判断,比如,“提高”和“调高”的意思相近度为90%,则可以进行替换。
还需要说明的是,在将语音控制命令对应的语音字数信息与唇语口型信息对应的口型变换次数信息进行比对时,如果语音控制命令对应的语音字数信息小于唇语口型信息对应的口型变换次数信息,此时可以根据替换原则进行替换,也可以认为语音信息解析失败。
本发明实施例,在将获取到的语音信息解析为语音控制命令后,首先根据获取到的语音信息解析出的语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,如果根据匹配结果确定解析出的语音控制命令中不存在噪音,则根据解析出的语音控制命令控制智能家居设备;如果根据匹配结果确定解析出的语音控制命令中存在噪音,则根据解析出的语音控制命令对应的语音字数信息与所述唇语口型信息滤除语音控制命令中的噪音,最后根据滤除噪音后的语音控制命令控制该智能家居设备,从而能够提高提取语音控制命令的精确度。
基于同一发明构思,本发明实施例中还提供了一种控制设备的装置,由于该装置对应的是本发明实施例提供的一种控制设备的方法对应的装置,并且该装置解决问题的原理与该方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
如图2所示,为本发明实施例提供的第一种控制设备的装置,该装置包括:至少一个处理单元200及至少一个存储单元201,其中,所述存储单元201存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执200执行下列过程:
将确定的语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,并根据匹配结果确定第一语音控制命令;
根据所述第一语音控制命令对所述智能家居设备进行控制。
可选的,所述处理单元200具体用于:
判断所述确定的语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度是否小于阈值,若是,则确定所述确定的语音控制命令存在噪音;
否则,确定所述确定的语音控制命令不存在噪音。
可选的,所述处理单元200具体用于:
若所述确定的语音控制命令存在噪音,则根据所述确定的语音控制命令对应的语音字数信息与所述唇语口型信息确定第一语音控制命令;
若所述确定的语音控制命令不存在噪音,则将所述确定的语音控制命令作为所述第一语音控制命令。
可选的,所述处理单元200具体用于:
若所述确定的语音控制命令对应的语音字数信息大于所述唇语口型信息对应的口型变换次数信息,则丢弃所述确定的语音控制命令中未匹配到唇语口型信息的语音控制命令,得到第二语音控制命令;
若所述第二语音控制命令对应的语音字数信息等于所述唇语口型信息对应的口型变换次数信息,且所述第二语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度小于阈值,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
可选的,所述处理单元200具体用于:
若所述确定的语音控制命令对应的语音字数信息不大于所述唇语口型信息对应的口型变换次数信息,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
可选的,所述处理单元200具体用于:
根据语音识别模型对获取到的语音信息进行解析,其中所述语音识别模型是根据语音信息、语音控制命令以及语音字数信息,通过神经网络训练得到的。
可选的,所述处理单元200具体用于:
根据图像识别模型对所述获取到的唇语口型信息进行解析,其中所述图像识别模型是根据唇语口型信息、口型变换次数信息以及替换词信息,通过神经网络训练得到的。
如图3所示,为本发明实施例提供的第二种控制设备的装置,该装置包括:确定模块300和控制模块301:
确定模块300:用于将确定的语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,并根据匹配结果确定第一语音控制命令;
控制模块301:用于根据所述第一语音控制命令对所述智能家居设备进行控制。
可选的,所述确定模块300具体用于:
判断所述确定的语音控制命令与用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度是否小于阈值,若是,则确定所述确定的语音控制命令存在噪音;
否则,确定所述确定的语音控制命令不存在噪音。
可选的,所述确定模块300具体用于:
若所述确定的语音控制命令存在噪音,则根据所述确定的语音控制命令对应的语音字数信息与所述唇语口型信息确定第一语音控制命令;
若所述确定的语音控制命令不存在噪音,则将所述确定的语音控制命令作为所述第一语音控制命令。
可选的,所述确定模块300具体用于:
若所述确定的语音控制命令对应的语音字数信息大于所述唇语口型信息对应的口型变换次数信息,则丢弃所述确定的语音控制命令中未匹配到唇语口型信息的语音控制命令,得到第二语音控制命令;
若所述第二语音控制命令对应的语音字数信息等于所述唇语口型信息对应的口型变换次数信息,且所述第二语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度小于阈值,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
可选的,所述确定模块300具体用于:
若所述确定的语音控制命令对应的语音字数信息不大于所述唇语口型信息对应的口型变换次数信息,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
可选的,所述确定模块300具体用于:
根据语音识别模型对获取到的语音信息进行解析,其中所述语音识别模型是根据语音信息、语音控制命令以及语音字数信息,通过神经网络训练得到的。
可选的,所述确定模块300具体用于:
根据图像识别模型对所述获取到的唇语口型信息进行解析,其中所述图像识别模型是根据唇语口型信息、口型变换次数信息以及替换词信息,通过神经网络训练得到的。
如图4所示,为本发明实施例提供的一种控制设备的完整方法,该方法包括如下步骤:
步骤400、获取语音信息和用户针对智能家居设备的唇语口型信息;
步骤401、解析语音信息和唇语口型信息;
步骤402、判断是否解析出语音控制指令,若是,则执行步骤403,否则退出;
步骤403、将语音控制指令与唇语口型信息进行匹配;
步骤404、判断匹配结果是否大于阈值,若是,则执行步骤411,否则执行步骤405;
步骤405、将解析语音信息得到的语音字数信息与解析唇语口型信息得到的口型变换次数信息进行比对;
步骤406、判断语音字数信息是否大于口型变换次数信息,若是,则执行步骤407,否则执行步骤408;
步骤407、丢弃语音控制命令中未匹配到唇语口型信息的语音控制命令,执行步骤403;
步骤408、判断语音字数信息是否等于口型变换次数信息,若是,则执行步骤409,否则退出;
步骤409、将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息;
步骤410、得到最终语音控制命令;
步骤411、根据最终的语音控制命令控制智能家居设备。
以上参照示出根据本申请实施例的方法、装置(***)和/或计算机程序产品的框图和/或流程图描述本申请。应理解,可以通过计算机程序命令来实现框图和/或流程图示图的一个块以及框图和/或流程图示图的块的组合。可以将这些计算机程序命令提供给通用计算机、专用计算机的处理器和/或其它可编程数据处理装置,以产生机器,使得经由计算机处理器和/或其它可编程数据处理装置执行的命令创建用于实现框图和/或流程图块中所指定的功能/动作的方法。
相应地,还可以用硬件和/或软件(包括固件、驻留软件、微码等)来实施本申请。更进一步地,本申请可以采取计算机可使用或计算机可读存储介质上的计算机程序产品的形式,其具有在介质中实现的计算机可使用或计算机可读程序代码,以由命令执行***来使用或结合命令执行***而使用。在本申请上下文中,计算机可使用或计算机可读介质可以是任意介质,其可以包含、存储、通信、传输、或传送程序,以由命令执行***、装置或设备使用,或结合命令执行***、装置或设备使用。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种控制设备的方法,其特征在于,该方法包括:
将确定的语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,并根据匹配结果确定第一语音控制命令;
根据所述第一语音控制命令对所述智能家居设备进行控制;
所述根据匹配结果确定第一语音控制命令,包括:
若所述确定的语音控制命令存在噪音,则根据所述确定的语音控制命令对应的语音字数信息与所述唇语口型信息确定第一语音控制命令;
若所述确定的语音控制命令不存在噪音,则将所述确定的语音控制命令作为所述第一语音控制命令。
2.如权利要求1所述的方法,其特征在于,通过下列方式确定所述匹配结果:
判断所述确定的语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度是否小于阈值,若是,则确定所述确定的语音控制命令存在噪音;
否则,确定所述确定的语音控制命令不存在噪音。
3.如权利要求1所述的方法,其特征在于,所述根据所述确定的语音控制命令对应的语音字数信息与所述唇语口型信息确定第一语音控制命令,包括:
若所述确定的语音控制命令对应的语音字数信息大于所述唇语口型信息对应的口型变换次数信息,则丢弃所述确定的语音控制命令中未匹配到唇语口型信息的语音控制命令,得到第二语音控制命令;
若所述第二语音控制命令对应的语音字数信息等于所述唇语口型信息对应的口型变换次数信息,且所述第二语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度小于阈值,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
4.如权利要求1所述的方法,其特征在于,所述根据所述确定的语音控制命令对应的语音字数信息与所述唇语口型信息确定第一语音控制命令,包括:
若所述确定的语音控制命令对应的语音字数信息不大于所述唇语口型信息对应的口型变换次数信息,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
5.如权利要求3或4所述的方法,其特征在于,通过下列方式确定所述确定的语音控制命令对应的语音字数信息:
根据语音识别模型对获取到的语音信息进行解析,其中所述语音识别模型是根据语音信息、语音控制命令以及语音字数信息,通过神经网络训练得到的。
6.如权利要求3或4所述的方法,其特征在于,通过下列方式确定所述唇语口型信息对应的口型变换次数信息以及替换词信息:
根据图像识别模型对所述获取到的唇语口型信息进行解析,其中所述图像识别模型是根据唇语口型信息、口型变换次数信息以及替换词信息,通过神经网络训练得到的。
7.一种控制设备的装置,其特征在于,该装置包括:至少一个处理单元及至少一个存储单元,其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行下列过程:
将确定的语音控制命令与用户发出针对智能家居设备的语音控制命令时的唇语口型信息进行匹配,并根据匹配结果确定第一语音控制命令;
根据所述第一语音控制命令对所述智能家居设备进行控制;
其中,所述处理单元具体用于:
若所述确定的语音控制命令存在噪音,则根据所述确定的语音控制命令对应的语音字数信息与所述唇语口型信息确定第一语音控制命令;
若所述确定的语音控制命令不存在噪音,则将所述确定的语音控制命令作为所述第一语音控制命令。
8.如权利要求7所述的装置,其特征在于,所述处理单元具体用于:
判断所述确定的语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度是否小于阈值,若是,则确定所述确定的语音控制命令存在噪音;
否则,确定所述确定的语音控制命令不存在噪音。
9.如权利要求7所述的装置,其特征在于,所述处理单元具体用于:
若所述确定的语音控制命令对应的语音字数信息大于所述唇语口型信息对应的口型变换次数信息,则丢弃所述确定的语音控制命令中未匹配到唇语口型信息的语音控制命令,得到第二语音控制命令;
若所述第二语音控制命令对应的语音字数信息等于所述唇语口型信息对应的口型变换次数信息,且所述第二语音控制命令与所述用户发出针对所述智能家居设备的语音控制指令时的唇语口型信息的匹配度小于阈值,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
10.如权利要求7所述的装置,其特征在于,所述处理单元具体用于:
若所述确定的语音控制命令对应的语音字数信息不大于所述唇语口型信息对应的口型变换次数信息,则将无法匹配唇语口型信息的语音控制命令根据替换原则替换为所述唇语口型信息对应的替换词信息得到第一语音控制命令。
11.如权利要求9或10所述的装置,其特征在于,所述处理单元具体用于:
根据语音识别模型对获取到的语音信息进行解析,其中所述语音识别模型是根据语音信息、语音控制命令以及语音字数信息,通过神经网络训练得到的。
12.如权利要求9或10所述的装置,其特征在于,所述处理单元具体用于:
根据图像识别模型对所述获取到的唇语口型信息进行解析,其中所述图像识别模型是根据唇语口型信息、口型变换次数信息以及替换词信息,通过神经网络训练得到的。
CN201811381967.3A 2018-11-20 2018-11-20 一种控制设备的方法与装置 Active CN109377995B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811381967.3A CN109377995B (zh) 2018-11-20 2018-11-20 一种控制设备的方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811381967.3A CN109377995B (zh) 2018-11-20 2018-11-20 一种控制设备的方法与装置

Publications (2)

Publication Number Publication Date
CN109377995A CN109377995A (zh) 2019-02-22
CN109377995B true CN109377995B (zh) 2021-06-01

Family

ID=65389650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811381967.3A Active CN109377995B (zh) 2018-11-20 2018-11-20 一种控制设备的方法与装置

Country Status (1)

Country Link
CN (1) CN109377995B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110276259B (zh) * 2019-05-21 2024-04-02 平安科技(深圳)有限公司 唇语识别方法、装置、计算机设备及存储介质
CN110262278B (zh) * 2019-07-31 2020-12-11 珠海格力电器股份有限公司 智能家电设备的控制方法及装置、智能电器设备
CN111028842B (zh) * 2019-12-10 2021-05-11 上海芯翌智能科技有限公司 触发语音交互响应的方法及设备
CN111243585B (zh) * 2020-01-07 2022-11-22 百度在线网络技术(北京)有限公司 多人场景下的控制方法、装置、设备及存储介质
CN111309283B (zh) * 2020-03-25 2023-12-05 北京百度网讯科技有限公司 用户界面的语音控制方法、装置、电子设备及存储介质
CN113763941A (zh) * 2020-06-01 2021-12-07 青岛海尔洗衣机有限公司 语音识别方法、语音识别***和电器设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324035A (zh) * 2011-08-19 2012-01-18 广东好帮手电子科技股份有限公司 口型辅助语音识别术在车载导航中应用的方法及***
CN102368198A (zh) * 2011-10-04 2012-03-07 上海量明科技发展有限公司 通过嘴唇图像进行信息提示的方法及***
CN103177238B (zh) * 2011-12-26 2019-01-15 宇龙计算机通信科技(深圳)有限公司 终端和用户识别方法
CN105096935B (zh) * 2014-05-06 2019-08-09 阿里巴巴集团控股有限公司 一种语音输入方法、装置和***
CN105703978A (zh) * 2014-11-24 2016-06-22 武汉物联远科技有限公司 智能家居控制***和方法
CN104409075B (zh) * 2014-11-28 2018-09-04 深圳创维-Rgb电子有限公司 语音识别方法和***
CN106157957A (zh) * 2015-04-28 2016-11-23 中兴通讯股份有限公司 语音识别方法、装置及用户设备
CN108346427A (zh) * 2018-02-05 2018-07-31 广东小天才科技有限公司 一种语音识别方法、装置、设备及存储介质
CN108428453A (zh) * 2018-03-27 2018-08-21 王凯 一种基于唇语识别的智能终端操控***

Also Published As

Publication number Publication date
CN109377995A (zh) 2019-02-22

Similar Documents

Publication Publication Date Title
CN109377995B (zh) 一种控制设备的方法与装置
CN108447480B (zh) 智能家居设备控制的方法、智能语音终端和网络设备
CN105471705B (zh) 一种基于即时通讯的智能控制方法、设备及***
CN102779509B (zh) 语音处理设备和语音处理方法
CN112820291B (zh) 智能家居控制方法、***和存储介质
CN105045140A (zh) 智能控制受控设备的方法和装置
CN106847281A (zh) 基于语音模糊识别技术的智能家居语音控制***及方法
CN109065051B (zh) 一种语音识别处理方法及装置
CN109032039A (zh) 一种语音控制的方法及装置
CN109343481B (zh) 一种控制设备的方法与设备
CN105182763A (zh) 一种基于语音识别的智能遥控器及实现方法
CN110579977B (zh) 一种电器设备的控制方法、装置及计算机可读存储介质
CN108932947B (zh) 语音控制方法及家电设备
CN114582318B (zh) 一种基于语音识别的智能家居控制方法及***
CN111583921A (zh) 语音控制方法、装置、计算机设备和存储介质
CN114791771A (zh) 智能语音鼠标的交互管理***及管理方法
CN108415572B (zh) 应用于移动终端的模块控制方法、装置及存储介质
CN113205809A (zh) 语音唤醒方法和装置
CN109976169B (zh) 基于自学习技术的互联网电视智能控制方法及控制***
WO2018023514A1 (zh) 一种家居背景音乐控制***
US9626967B2 (en) Information processing method and electronic device
CN110970019A (zh) 智能家居***的控制方法和装置
WO2018023518A1 (zh) 一种语音交互识别智能终端
CN112331203A (zh) 智能家居设备控制方法、装置、电子设备及存储介质
CN112669832A (zh) 一种智能设备的语义理解方法、智能设备、管理平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant