CN107731226A - 基于语音识别的控制方法、装置及电子设备 - Google Patents

基于语音识别的控制方法、装置及电子设备 Download PDF

Info

Publication number
CN107731226A
CN107731226A CN201710908956.5A CN201710908956A CN107731226A CN 107731226 A CN107731226 A CN 107731226A CN 201710908956 A CN201710908956 A CN 201710908956A CN 107731226 A CN107731226 A CN 107731226A
Authority
CN
China
Prior art keywords
word
phrase
voice
voice messaging
voice signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710908956.5A
Other languages
English (en)
Inventor
夏春波
金晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Congpu Intelligent Technology Co Ltd
Original Assignee
Hangzhou Congpu Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Congpu Intelligent Technology Co Ltd filed Critical Hangzhou Congpu Intelligent Technology Co Ltd
Priority to CN201710908956.5A priority Critical patent/CN107731226A/zh
Publication of CN107731226A publication Critical patent/CN107731226A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种基于语音识别的控制方法、装置及电子设备,涉及智能控制的技术领域,该方法包括:在智能家居设备处于已唤醒状态的情况下,采集第一语音信号,其中,第一语音信号中携带第一语音信息;判断第一语音信息是否为执行词组中的词语,其中,执行词组中包括预先进行训练得到的至少一个执行词语,且每个执行词语对应一个目标动作;在判断出是的情况下,根据第一语音信息生成第一控制指令,以根据第一控制指令控制智能家居设备执行对应的目标动作,缓解了现有技术中存在的语音识别错误率较高的技术问题。

Description

基于语音识别的控制方法、装置及电子设备
技术领域
本发明涉及智能控制的技术领域,尤其是涉及一种基于语音识别的控制方法、装置及电子设备。
背景技术
随着物联网概念的不断推广,物联网相关技术的不断发展以及物联网配套产品的生产成本不断降低。物联网产品已经越来越多的投放到市场,作为物联网产业一个重要分支的智能家居行业,也开始进入普通人的家居生活当中。通过传统的墙装面板或者手持终端来控制设备的方式越来越不能满足用户的需求。基于语音识别技术的产品,伴随着语音技术的不断创新发展,实用性的不断提高,越来越受到消费者的青睐。现有技术中,语音控制***采用语音芯片对语音信号的分析,将其转变为控制信号传送给单片机,再通过单片机对智能家居设备进行控制,从而达到通过最便捷的方式进行智能家居产品的语音控制目的。但是,目前的基于语音识别的智能家居产品依然存在着使用不便、识别不准确、***设计不人性化、成本偏高、需要通过云端进行识别等问题,影响语音识别产品的进一步推广。
针对上述问题,还未提出有效解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种基于语音识别的控制方法、装置及电子设备,以缓解了现有技术中存在的语音识别错误率较高的技术问题。
第一方面,本发明实施例提供了一种基于语音识别的控制方法,包括:在智能家居设备处于已唤醒状态的情况下,采集第一语音信号,其中,所述第一语音信号中携带第一语音信息;判断所述第一语音信息是否为执行词组中的词语,其中,所述执行词组中包括预先进行训练得到的至少一个执行词语,且每个执行词语对应一个目标动作;在判断出是的情况下,根据所述第一语音信息生成第一控制指令,以根据所述第一控制指令控制智能家居设备执行对应的目标动作。
进一步地,判断所述第一语音信息是否为执行词组中词语包括:判断所述第一语音信号是否有效音频信号;在判断出所述第一语音信号是所述有效音频信号的情况下,将所述第一语音信息与所述执行词组进行对比,以确定所述第一语音信息是否为所述执行词组中的词语;在对比结果为是的情况下,确定所述第一语音信息为所述执行词组中的词语。
进一步地,在采集第一语音信号之前,所述方法还包括:采集第二语音信号,其中,所述第二语音信号中携带第二语音信息;判断所述第二语音信息是否为唤醒词组中的词语,其中,所述唤醒词组中包括预先进行训练得到的至少一个唤醒词语;在判断出是的情况下,根据所述第二语音信息生成第二控制指令,以根据所述第二控制指令控制智能家居设备执行对应的目标动作。
进一步地,判断所述第二语音信息是否为唤醒词组中的词语包括:判断所述第二语音信号是否有效音频信号;在判断出所述第二语音信号是所述有效音频信号的情况下,将所述第二语音信号与所述唤醒词组进行对比,以确定所述第二语音信息是否为所述唤醒词组中的词语;在对比结果为是的情况下,确定所述第二语音信息为所述唤醒词组中的词语。
进一步地,根据所述第一语音信息生成第一控制指令包括:在所述执行词组中查找与所述第一语音信息相匹配的目标执行词语;查询所述目标执行词语所对应的目标动作;基于所述所对应的目标动作生成所述第一控制指令,以使所述智能家居设备执行所述对应的目标动作。
第二方面,本发明实施例还提供一种基于语音识别的控制装置,包括:采集单元,用于在智能家居设备处于已唤醒状态的情况下,采集第一语音信号,其中,所述第一语音信号中携带第一语音信息;判断单元,用于判断所述第一语音信息是否为执行词组中的词语,其中,所述执行词组中包括预先进行训练得到的至少一个执行词语,且每个执行词语对应一个目标动作;生成单元,用于在判断出是的情况下,根据所述第一语音信息生成第一控制指令,以根据所述第一控制指令控制智能家居设备执行对应的目标动作。
进一步地,所述判断单元用于:判断所述第一语音信号是否有效音频信号;在判断出所述第一语音信号是所述有效音频信号的情况下,将所述第一语音信息与所述执行词组进行对比,以确定所述第一语音信息是否为所述执行词组中的词语;在对比结果为是的情况下,确定所述第一语音信息为所述执行词组中的词语。
进一步地,所述装置还用于:在采集第一语音信号之前,采集第二语音信号,其中,所述第二语音信号中携带第二语音信息;判断所述第二语音信息是否为唤醒词组中的词语,其中,所述唤醒词组中包括预先进行训练得到的至少一个唤醒词语;在判断出是的情况下,根据所述第二语音信息生成第二控制指令,以根据所述第二控制指令控制智能家居设备执行对应的目标动作。
第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述权利要求任一项所述的方法。
第四方面,本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行所述权利要求所述方法。
在本发明实施例中,在智能家居设备处于已唤醒状态的情况下,采集第一语音信号,其中,所述第一语音信号中携带第一语音信息;然后,判断所述第一语音信息是否为执行词组中的词语,其中,所述执行词组中包括预先进行训练得到的至少一个执行词语,且每个执行词语对应一个目标动作;在判断出是的情况下,根据所述第一语音信息生成第一控制指令,以根据所述第一控制指令控制智能家居设备执行对应的目标动作。在本发明实施例中,在智能家居设备处于唤醒状态的情况下,对智能家居设备进行控制,能够降低语音识别的错误触发的概率,进而缓解了现有技术中存在的语音识别错误率较高的技术问题。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种基于语音识别的控制方法的流程图;
图2是根据本发明实施例的另一种可选地基于语音识别的控制方法的流程图;
图3是根据本发明实施例的一种基于语音识别的控制装置的示意图;
图4是根据本发明实施例的一种电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据本发明实施例,提供了一种基于语音识别的控制方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种基于语音识别的控制方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,在智能家居设备处于已唤醒状态的情况下,采集第一语音信号,其中,所述第一语音信号中携带第一语音信息;
在本发明实施例中,在对智能家居设备进行控制之前,需要唤醒该智能家居设备,然后,再对该智能家居设备进行操作。如果不用设置唤醒机制,那么由于智能家居设备主要是设置在家庭中,因此,家庭成员所说的话会在不经意间触发智能家居设备执行某种不必要的操作,从而造成资源的浪费。通过设置在唤醒机制,能够使智能家居设备在处于唤醒的状态下,才能够被控制。
步骤S104,判断所述第一语音信息是否为执行词组中的词语,其中,所述执行词组中包括预先进行训练得到的至少一个执行词语,且每个执行词语对应一个目标动作;
在本发明实施例中,在采集到第一语音信息之后,判断第一语音信息是否为执行词组中的词语,其中,如果判断出是,则控制智能家居设备执行目标动作。
步骤S106,在判断出是的情况下,根据所述第一语音信息生成第一控制指令,以根据所述第一控制指令控制智能家居设备执行对应的目标动作。
在本发明实施例中,在智能家居设备处于已唤醒状态的情况下,采集第一语音信号,其中,所述第一语音信号中携带第一语音信息;然后,判断所述第一语音信息是否为执行词组中的词语,其中,所述执行词组中包括预先进行训练得到的至少一个执行词语,且每个执行词语对应一个目标动作;在判断出是的情况下,根据所述第一语音信息生成第一控制指令,以根据所述第一控制指令控制智能家居设备执行对应的目标动作。在本发明实施例中,在智能家居设备处于唤醒状态的情况下,对智能家居设备进行控制,能够降低语音识别的错误触发的概率,进而缓解了现有技术中存在的语音识别错误率较高的技术问题。
需要说明的是,在本发明实施例中,执行词语和唤醒词语的训练方法为隐马尔科夫法(HMM)。HMM是对语音信号的时间序列结构建立统计模型,将之看作一个数学上的双重随机过程:一个是用具有有限状态数的 Markov链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与 Markov链的每一个状态相关联的观测序列的随机过程。前者通过后者表现出来,但前者的具体参数是不可测的。人的言语过程实际上就是一个双重随机过程,语音信号本身是一个可观测的时变序列,是由大脑根据语法知识和言语需要(不可观测的状态)发出的音素的参数流。人的言语过程实际上就是一个双重随机过程,语音信号本身是一个可观测的时变序列,是由大脑根据语法知识和言语需要(不可观测的状态)发出的音素的参数流。可见 HMM合理地模仿了这一过程,很好地描述了语音信号的整体非平稳性和局部平稳性,是较为理想的一种语音训练方法。其中,执行词语只有在唤醒词语被识别之后才能实现功能,这样设置可以减少误触发概率。
通过上述描述可知,在本发明实施例中,在对智能家居设备进行控制之前,需要对智能家居设备进行唤醒。
在一个可选的实施方式中,唤醒智能家居设备的过程描述如下:
首先,在采集第一语音信号之前,采集第二语音信号,其中,所述第二语音信号中携带第二语音信息;
然后,判断所述第二语音信息是否为唤醒词组中的词语,其中,所述唤醒词组中包括预先进行训练得到的至少一个唤醒词语;
其中,判断所述第二语音信息是否为唤醒词组中的词语的具体过程描述如下:判断所述第二语音信号是否有效音频信号;在判断出所述第二语音信号是所述有效音频信号的情况下,将所述第二语音信号与所述唤醒词组进行对比,以确定所述第二语音信息是否为所述唤醒词组中的词语;在对比结果为是的情况下,确定所述第二语音信息为所述唤醒词组中的词语。
最后,在判断出是的情况下,根据所述第二语音信息生成第二控制指令,以根据所述第二控制指令控制智能家居设备执行对应的目标动作。
在本发明实施例中,当智能家居设备处于休眠状态时,用户可以用过语音信号唤醒该智能家居设备,在唤醒该智能家居设备之后,就可以对该智能家居设备执行相关的操作,例如,开启,关闭,调档等操作。
在智能家居设备处于休眠状态时,用于采集语音信号的采集器可以实时采集语音信号(即,上述第二语音信号),其中,在该第二语音信号中携带第二语音信息。然后,判断该第二语音信息是否为唤醒词组中的词语。如果判断出是,则生成第二控制指令,并根据该第二控制指令控制该智能家居设备处于唤醒状态。
通过上述描述可知,在本发明实施例中,唤醒词组中的唤醒词语为预先通过隐马尔科夫法进行训练得到的。除了该训练方式之外,还可以采用各类神经网络,支持向量机等分类器来完成唤醒词组的训练工作。
需要说明的是,在本发明实施例中,唤醒词组可以设置为多组,例如,为每个城市,或者,每个省份设置一组唤醒词组。例如,为北京设置一组唤醒词组;为天津设置另外一组唤醒词组;为河北省设置另外一组唤醒词组。
在本发明实施例中,按照不同的地理位置设置不同的唤醒词组的目的是,考虑到地理位置跨度较大的用户之间所使用词语的差异也较大,因此,通过该设置方式,能够使得该智能家居设备能够适应每个地域的说话习惯,而不是用户去适应该智能家居设备的设置方式,使得该智能家居设备更加智能化。
针对不同地域的唤醒词组,均可以采用上述使用的HMM方法来进行训练,除此之外,还可以采用各种神经网络,各种支持向量机等分类器来实现不同地域的唤醒词组的训练。
在训练得到不同地域的唤醒词组之后,就可以基于该不同地域的唤醒词组设置不同的唤醒机制,该唤醒机制为唤醒智能家居设备的机制。下面,将结合下述具体的实施方式对该唤醒机制进行介绍。
实施方式一、
语音信号的采集器在采集得到第二语音信号之后,判断该第二语音信号是否为普通话,其中,处理器可以通过判断该第二语音信号与普通话之间的相似程度来确定该第二语音信号是否为普通话。如果判断出该第二语音信号为普通话,则将该第二语音信号中所携带的第二语音信息与唤醒词组1中的唤醒词语进行对比,其中,唤醒词组1为普通话的唤醒词语。
如果判断出该第二语音信号不是普通话,则确定该第二语音信号所属的地域信息;其中,可以分别计算第二语音信号与各个方言之间的相似程度,以确定第二语音信号所属的地域信息;除此之外,还可以将第二语音信号作为目标神经网络的输入,以使目标神经网络对第二语音信号进行识别,以识别第二语音信号所属的地域,其中,目标神经网络为预先训练好的用于识别语音信号所属地域信息的神经网络。
在确定出第二语音信号所属的地域信息之后,就可以将该第二语音信息所携带的第二语音信息与该地域信息所属的唤醒词组中的唤醒词语进行对比,以确定该第二语音信息是否为唤醒词组中的词语。下面将一个具体的实施例介绍上述实施方式一。
例如,某用户所属的地域为四川,该用户所说语音为四川方言。当用户想要唤醒该智能家居设备时,可以向该智能家居设备发送语音信号(即,第二语音信号)。语音信号的采集器在采集到该语音信号之后,将判断该语音信号是否为普通话,通过判断可知,该语音信号不是普通话。此时,将进一步确定该语音信号所属的地理位置。其中,可以计算该语音信号与各种方言之间的相似度,以确定该语音信号所属的地理位置;还可以通过目标神经网络来确定该语音信号所属的地理位置。在本发明实施例中,通过上述任一种方式就可以确定该语音信号所属的地理位置为四川。
在确定出该语音信号的地理位置之后,就可以将该语音信号所携带的语音信息与四川所属的唤醒词组进行对比。以确定该语音信号是否为该唤醒词组中的词语。其中,如果判断出是,则控制智能家居设备处于唤醒状态。
实施方式二、
在本发明实施例中,用户可以设置该智能家居设备的识别模式,例如,设置该智能家居设备的识别模式为普通话识别模式,或者方言识别模式。其中,用户可以手动设置该识别模式,还可以通过语音来设置该识别模式,对此不作具体限定。
在设置智能家居设备的识别模式之后,智能家居设备的语音信号的采集器就可以采集用户发出的语音信号(即,上述第二语音信号)。然后,按照上述设置的识别模式对语音信号所携带的语音信息进行识别。进而根据识别结果生成第二控制指令,以根据该第二控制指令控制智能家居设备执行对应的目标动作。下面将一个具体的实施例介绍上述实施方式二。
例如,用户通过语音的设置方式来设置智能家居设备的识别模式为方言识别模式,进一步地,还可以设置为哪种方言的识别模式。假设,该用户通过语音的设置方式设置的方言识别模式为四川方言的识别模式。
在设置完成该方言识别模式之后,就可以采集用户发出的语音信号 (即,上述第二语音信号)。在采集到该语音信号之后,就可以对该语音信号进行分析,具体地,可以将该语音信号所携带的语音信息与四川所属的唤醒词语进行对比,然后,根据对比结果生成第二控制指令,以根据该第二控制指令控制智能家居设备执行对应的目标动作。
在本发明实施例中,通过上述实施方式一和实施方式二能够使得该智能家居设备能够适应各种地域的语言,而不是用户去适应智能家居设备的识别方式,使得该智能家居设备的识别过程更加人性化和智能化。
在本发明实施例中,在智能家居设备处于已唤醒状态的情况下,就可以实时采集第一语音信号,并判断采集到的第一语音信号是否为执行词组中词语。
在本发明实施例的另一个可选的实施方式中,判断采集到的第一语音信号是否为执行词组中词语包括如下过程:
步骤S1,判断所述第一语音信号是否有效音频信号;
步骤S2,在判断出所述第一语音信号是所述有效音频信号的情况下,将所述第一语音信息与所述执行词组进行对比,以确定所述第一语音信息是否为所述执行词组中的词语;
步骤S3,在对比结果为是的情况下,确定所述第一语音信息为所述执行词组中的词语。
在本发明实施例中,在采集到第一语音信号之后,判断该第一语音信号是否为有效音频信号;如果判断出是有效音频信号,则将第一语音信号所携带的第一语音信息与执行词组中的执行词语进行对比,以根据对比结果确定该第一语音信息是否为执行词组中的词语。如果判断出是,则确定第一语音信息为执行词组中的词语。
在本发明实施例中,在判断出该第一语音信息是执行词组中的词语之后,就可以根据所述第一语音信息生成第一控制指令,具体过程描述如下:
在所述执行词组中查找与所述第一语音信息相匹配的目标执行词语;
查询所述目标执行词语所对应的目标动作;
基于所述所对应的目标动作生成所述第一控制指令,以使所述智能家居设备执行所述对应的目标动作。
具体地,执行词组中包括的词语可以包括:开启,关闭,增大,减小,快,慢等各种词。如果用户发出的第一语音信号中所携带的第一语音信息为:“开启”,则在执行词组中查找到与“开启”相匹配的目标执行词语(例如,为开启设备),并在查找到开启设备之后,查询开启设备所对应的目标动作 (例如,为开启动作),以根据开启动作生成所述第一控制指令(即,开启指令),以使所述智能家居设备执行开启动作。
需要说明的是,在本发明实施例中,在判断第一语音信号是否为执行词组中的词语时,同样可以采用上述实施方式一和实施方式二所描述的方案来实现第一语音信息的分析过程。
当采用上述实施方式一所描述的过程来分析第一语音信号时,具体过程描述如下:
语音信号的采集器在采集得到第一语音信号之后,判断该第一语音信号是否为有效语音信号,在判断出是的情况下,继续判断该第一语音信号是否为普通话,其中,处理器可以通过判断该第一语音信号与普通话之间的相似程度来确定该第一语音信号是否为普通话。如果判断出该第一语音信号为普通话,则将该第一语音信号中所携带的第一语音信息与执行词组1 中的执行词语进行对比,其中,执行词组1为普通话的执行词语。
如果判断出该第一语音信号不是普通话,则确定该第一语音信号所属的地域信息;其中,可以分别计算第一语音信号与各个方言之间的相似程度,以确定第一语音信号所属的地域信息;除此之外,还可以将第一语音信号作为目标神经网络的输入,以使目标神经网络对第一语音信号进行识别,以识别第一语音信号所属的地域,其中,目标神经网络为预先训练好的用于识别语音信号所属地域信息的神经网络。
在确定出第一语音信号所属的地域信息之后,就可以将该第一语音信息所携带的第一语音信息与该地域信息所属的执行词组中的执行词语进行对比,以确定该第一语音信息是否为执行词组中的词语。
当采用上述实施方式二所描述的过程来分析第一语音信号时,具体过程描述如下:
在本发明实施例中,如果用户在唤醒该智能家居设备时已设置该智能家居设备的识别模式,那么在对第一语音信号进行分析时,直接按照该识别模式对其进行分析即可。例如,当用户在唤醒智能家居设备时设置的识别模式为方言识别模式,那么在设置智能家居设备处于唤醒模式之后,智能家居设备的语音信号的采集器就可以采集用户发出的语音信号(即,上述第一语音信号)。然后,按照上述设置的识别模式对语音信号所携带的语音信息(即,第一语音信息)进行识别。进而根据识别结果生成第一控制指令,以根据该第一控制指令控制智能家居设备执行对应的目标动作。
通过上述描述可知,在本发明实施例所提供的方法,突破了传统的由接触的方式来实现的对于智能产品的控制;突破了必须联网才能够识别语音信息的限制,能够直接在本地实现语音信息的识别;在本发明实施例中,以唤醒的模式进行触发,然后进行操作控制,大大降低了语音识别的错误触发的几率。同时,在本发明实施例中,设置了不同的方言的识别模式,以满足不同地区的用户需求。需要说明的是,在本发明实施例中,该方法除了能够识别中文之外,还能够识别英文,韩文和日文等常用语言。
综上各实施例提供的基于语音识别的控制方法,为了直观理解上述过程,以图2所示的基于语音识别的控制方法的示意图为例进行说明,该方法主要包括如下步骤:
步骤S201,采集语音信号A(即,上述第二语音信号);
步骤S202,判断语音信号A是否为有效音频信号;其中,如果判断出是,则执行步骤S203,否则返回继续执行步骤S201;
步骤S203,判断该语音信号A中所携带的语音信息是否为关键词;其中,如果判断出是,则执行步骤S204,否则返回继续执行步骤S201;
步骤S204,判断该语音信号A中所携带的语音信息是否为唤醒词语;其中,如果判断出是,则执行步骤S205,否则返回继续执行步骤S201;
步骤S205,采集语音信号B(即,上述第一语音信号);
步骤S206,判断语音信号B是否为有效音频信号;其中,如果判断出是,则执行步骤S207,否则返回继续执行步骤S205;
步骤S207,判断该语音信号B中所携带的语音信息是否为执行词语;其中,如果判断出是,则执行步骤S209,否则执行步骤S208;
步骤S208,判断该语音信号B中所携带的语音信息是否为唤醒词语,其中,如果判断出是,则返回继续执行步骤S205,否则返回继续执行步骤 S201;
步骤S209,基于语音信号B生成控制指令;
步骤S210,通过数据通讯单元向智能家居设备发送该控制指令,以使智能家居设备执行目标动作。具体实现过程如上所述,这里不再赘述。
实施例二:
本发明实施例还提供了一种基于语音识别的控制装置,该基于语音识别的控制装置主要用于执行本发明实施例上述内容所提供的基于语音识别的控制方法,以下对本发明实施例提供的基于语音识别的控制装置做具体介绍。
图3是根据本发明实施例的一种基于语音识别的控制装置的示意图,如图3所示,该基于语音识别的控制装置主要包括:采集单元10,判断单元20和生成单元30,其中:
采集单元,用于在智能家居设备处于已唤醒状态的情况下,采集第一语音信号,其中,所述第一语音信号中携带第一语音信息;
判断单元,用于判断所述第一语音信息是否为执行词组中的词语,其中,所述执行词组中包括预先进行训练得到的至少一个执行词语,且每个执行词语对应一个目标动作;
生成单元,用于在判断出是的情况下,根据所述第一语音信息生成第一控制指令,以根据所述第一控制指令控制智能家居设备执行对应的目标动作。
在本发明实施例中,在智能家居设备处于已唤醒状态的情况下,采集第一语音信号,其中,所述第一语音信号中携带第一语音信息;然后,判断所述第一语音信息是否为执行词组中的词语,其中,所述执行词组中包括预先进行训练得到的至少一个执行词语,且每个执行词语对应一个目标动作;在判断出是的情况下,根据所述第一语音信息生成第一控制指令,以根据所述第一控制指令控制智能家居设备执行对应的目标动作。在本发明实施例中,在智能家居设备处于唤醒状态的情况下,对智能家居设备进行控制,能够降低语音识别的错误触发的概率,进而缓解了现有技术中存在的语音识别错误率较高的技术问题。
进一步地,所述判断单元用于:判断所述第一语音信号是否有效音频信号;在判断出所述第一语音信号是所述有效音频信号的情况下,将所述第一语音信息与所述执行词组进行对比,以确定所述第一语音信息是否为所述执行词组中的词语;在对比结果为是的情况下,确定所述第一语音信息为所述执行词组中的词语。
进一步地,所述装置还用于:在采集第一语音信号之前,采集第二语音信号,其中,所述第二语音信号中携带第二语音信息;判断所述第二语音信息是否为唤醒词组中的词语,其中,所述唤醒词组中包括预先进行训练得到的至少一个唤醒词语;在判断出是的情况下,根据所述第二语音信息生成第二控制指令,以根据所述第二控制指令控制智能家居设备执行对应的目标动作。
进一步地,所述装置还用于:判断所述第二语音信号是否有效音频信号;在判断出所述第二语音信号是所述有效音频信号的情况下,将所述第二语音信号与所述唤醒词组进行对比,以确定所述第二语音信息是否为所述唤醒词组中的词语;在对比结果为是的情况下,确定所述第二语音信息为所述唤醒词组中的词语。
进一步地,生成单元用于:在所述执行词组中查找与所述第一语音信息相匹配的目标执行词语;查询所述目标执行词语所对应的目标动作;基于所述所对应的目标动作生成所述第一控制指令,以使所述智能家居设备执行所述对应的目标动作。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
附图中的流程图和框图显示了根据本发明的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/ 或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本发明实施例提供的基于语音识别的控制装置,与上述实施例提供的基于语音识别的控制方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
实施例三:
参见图4,本发明实施例还提供一种电子设备100,包括:处理器40,存储器41,总线42和通信接口43,所述处理器40、通信接口43和存储器 41通过总线42连接;处理器40用于执行存储器41中存储的可执行模块,例如计算机程序。
其中,存储器41可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口43(可以是有线或者无线)实现该***网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线42可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器41用于存储程序,所述处理器40在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器40中,或者由处理器40实现。
处理器40可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器40中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器40可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器41,处理器40读取存储器41中的信息,结合其硬件完成上述方法的步骤。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明实施例所提供的一种基于语音识别的控制方法、装置及电子设备)的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种基于语音识别的控制方法,其特征在于,包括:
在智能家居设备处于已唤醒状态的情况下,采集第一语音信号,其中,所述第一语音信号中携带第一语音信息;
判断所述第一语音信息是否为执行词组中的词语,其中,所述执行词组中包括预先进行训练得到的至少一个执行词语,且每个执行词语对应一个目标动作;
在判断出是的情况下,根据所述第一语音信息生成第一控制指令,以根据所述第一控制指令控制智能家居设备执行对应的目标动作。
2.根据权利要求1所述的方法,其特征在于,判断所述第一语音信息是否为执行词组中词语包括:
判断所述第一语音信号是否有效音频信号;
在判断出所述第一语音信号是所述有效音频信号的情况下,将所述第一语音信息与所述执行词组进行对比,以确定所述第一语音信息是否为所述执行词组中的词语;
在对比结果为是的情况下,确定所述第一语音信息为所述执行词组中的词语。
3.根据权利要求1或2所述的方法,其特征在于,在采集第一语音信号之前,所述方法还包括:
采集第二语音信号,其中,所述第二语音信号中携带第二语音信息;
判断所述第二语音信息是否为唤醒词组中的词语,其中,所述唤醒词组中包括预先进行训练得到的至少一个唤醒词语;
在判断出是的情况下,根据所述第二语音信息生成第二控制指令,以根据所述第二控制指令控制智能家居设备执行对应的目标动作。
4.根据权利要求3所述的方法,其特征在于,判断所述第二语音信息是否为唤醒词组中的词语包括:
判断所述第二语音信号是否有效音频信号;
在判断出所述第二语音信号是所述有效音频信号的情况下,将所述第二语音信号与所述唤醒词组进行对比,以确定所述第二语音信息是否为所述唤醒词组中的词语;
在对比结果为是的情况下,确定所述第二语音信息为所述唤醒词组中的词语。
5.根据权利要求1所述的方法,其特征在于,根据所述第一语音信息生成第一控制指令包括:
在所述执行词组中查找与所述第一语音信息相匹配的目标执行词语;
查询所述目标执行词语所对应的目标动作;
基于所述所对应的目标动作生成所述第一控制指令,以使所述智能家居设备执行所述对应的目标动作。
6.一种基于语音识别的控制装置,其特征在于,包括:
采集单元,用于在智能家居设备处于已唤醒状态的情况下,采集第一语音信号,其中,所述第一语音信号中携带第一语音信息;
判断单元,用于判断所述第一语音信息是否为执行词组中的词语,其中,所述执行词组中包括预先进行训练得到的至少一个执行词语,且每个执行词语对应一个目标动作;
生成单元,用于在判断出是的情况下,根据所述第一语音信息生成第一控制指令,以根据所述第一控制指令控制智能家居设备执行对应的目标动作。
7.根据权利要求6所述的装置,其特征在于,所述判断单元用于:
判断所述第一语音信号是否有效音频信号;
在判断出所述第一语音信号是所述有效音频信号的情况下,将所述第一语音信息与所述执行词组进行对比,以确定所述第一语音信息是否为所述执行词组中的词语;
在对比结果为是的情况下,确定所述第一语音信息为所述执行词组中的词语。
8.根据权利要求6或7所述的装置,其特征在于,所述装置还用于:在采集第一语音信号之前,采集第二语音信号,其中,所述第二语音信号中携带第二语音信息;判断所述第二语音信息是否为唤醒词组中的词语,其中,所述唤醒词组中包括预先进行训练得到的至少一个唤醒词语;在判断出是的情况下,根据所述第二语音信息生成第二控制指令,以根据所述第二控制指令控制智能家居设备执行对应的目标动作。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至6中任一项所述的方法。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求1-6中任一所述方法。
CN201710908956.5A 2017-09-29 2017-09-29 基于语音识别的控制方法、装置及电子设备 Pending CN107731226A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710908956.5A CN107731226A (zh) 2017-09-29 2017-09-29 基于语音识别的控制方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710908956.5A CN107731226A (zh) 2017-09-29 2017-09-29 基于语音识别的控制方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN107731226A true CN107731226A (zh) 2018-02-23

Family

ID=61208832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710908956.5A Pending CN107731226A (zh) 2017-09-29 2017-09-29 基于语音识别的控制方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN107731226A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108196467A (zh) * 2018-03-21 2018-06-22 王伟才 一种基于物联网的智能家居控制***
CN108646580A (zh) * 2018-05-14 2018-10-12 中兴通讯股份有限公司 控制对象的确定方法及装置、存储介质、电子装置
CN109599103A (zh) * 2018-11-16 2019-04-09 广州小鹏汽车科技有限公司 车辆控制方法、装置、***、计算机可读存储介质和汽车
CN110414582A (zh) * 2019-07-21 2019-11-05 珠海格力电器股份有限公司 一种模型训练方法、装置、计算设备及存储介质
CN111312250A (zh) * 2020-02-21 2020-06-19 珠海荣邦电子科技有限公司 基于语音的多设备适配控制方法、装置及***
CN111627439A (zh) * 2020-05-21 2020-09-04 腾讯科技(深圳)有限公司 音频数据的处理方法和装置、存储介质和电子设备
CN114999137A (zh) * 2022-06-13 2022-09-02 江门市征极光兆科技有限公司 一种基于离线语音实现分组控制的遥控器、受控设备及方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103292437A (zh) * 2013-06-17 2013-09-11 广东美的制冷设备有限公司 语音交互式空调器及其控制方法
CN103714815A (zh) * 2013-12-09 2014-04-09 何永 语音控制方法及其设备
CN104464723A (zh) * 2014-12-16 2015-03-25 科大讯飞股份有限公司 一种语音交互方法及***
CN105224073A (zh) * 2015-08-27 2016-01-06 华南理工大学 一种基于语音控制的点读手表及其点读方法
CN105632486A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
CN105976814A (zh) * 2015-12-10 2016-09-28 乐视致新电子科技(天津)有限公司 头戴设备的控制方法和装置
US20170213552A1 (en) * 2016-01-26 2017-07-27 Motorola Mobility Llc Detection of audio public announcements by a mobile device
CN106997762A (zh) * 2017-03-08 2017-08-01 广东美的制冷设备有限公司 家用电器的语音控制方法以及装置
CN107016993A (zh) * 2017-05-15 2017-08-04 成都铅笔科技有限公司 一种智能家居的语音交互***及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103292437A (zh) * 2013-06-17 2013-09-11 广东美的制冷设备有限公司 语音交互式空调器及其控制方法
CN103714815A (zh) * 2013-12-09 2014-04-09 何永 语音控制方法及其设备
CN104464723A (zh) * 2014-12-16 2015-03-25 科大讯飞股份有限公司 一种语音交互方法及***
CN105224073A (zh) * 2015-08-27 2016-01-06 华南理工大学 一种基于语音控制的点读手表及其点读方法
CN105976814A (zh) * 2015-12-10 2016-09-28 乐视致新电子科技(天津)有限公司 头戴设备的控制方法和装置
CN105632486A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
US20170213552A1 (en) * 2016-01-26 2017-07-27 Motorola Mobility Llc Detection of audio public announcements by a mobile device
CN106997762A (zh) * 2017-03-08 2017-08-01 广东美的制冷设备有限公司 家用电器的语音控制方法以及装置
CN107016993A (zh) * 2017-05-15 2017-08-04 成都铅笔科技有限公司 一种智能家居的语音交互***及方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108196467A (zh) * 2018-03-21 2018-06-22 王伟才 一种基于物联网的智能家居控制***
CN108646580A (zh) * 2018-05-14 2018-10-12 中兴通讯股份有限公司 控制对象的确定方法及装置、存储介质、电子装置
CN109599103A (zh) * 2018-11-16 2019-04-09 广州小鹏汽车科技有限公司 车辆控制方法、装置、***、计算机可读存储介质和汽车
CN110414582A (zh) * 2019-07-21 2019-11-05 珠海格力电器股份有限公司 一种模型训练方法、装置、计算设备及存储介质
CN111312250A (zh) * 2020-02-21 2020-06-19 珠海荣邦电子科技有限公司 基于语音的多设备适配控制方法、装置及***
CN111627439A (zh) * 2020-05-21 2020-09-04 腾讯科技(深圳)有限公司 音频数据的处理方法和装置、存储介质和电子设备
CN111627439B (zh) * 2020-05-21 2022-07-22 腾讯科技(深圳)有限公司 音频数据的处理方法和装置、存储介质和电子设备
CN114999137A (zh) * 2022-06-13 2022-09-02 江门市征极光兆科技有限公司 一种基于离线语音实现分组控制的遥控器、受控设备及方法

Similar Documents

Publication Publication Date Title
CN107731226A (zh) 基于语音识别的控制方法、装置及电子设备
CN108182937B (zh) 关键词识别方法、装置、设备及存储介质
US11848008B2 (en) Artificial intelligence-based wakeup word detection method and apparatus, device, and medium
CN103903619B (zh) 一种提高语音识别准确率的方法及***
EP2940684B1 (en) Voice recognizing method and system for personalized user information
CN110020422A (zh) 特征词的确定方法、装置和服务器
CN108735201B (zh) 连续语音识别方法、装置、设备和存储介质
CN112001175B (zh) 流程自动化方法、装置、电子设备及存储介质
CN111797632B (zh) 信息处理方法、装置及电子设备
CN110517664A (zh) 多方言识别方法、装置、设备及可读存储介质
CN104143329A (zh) 进行语音关键词检索的方法及装置
CN104142909A (zh) 一种汉字注音方法及装置
CN107403619A (zh) 一种应用于自行车环境的语音控制方法及***
CN109192192A (zh) 一种语种识别方法、装置、翻译机、介质和设备
CN110942763A (zh) 语音识别方法及装置
CN108228808A (zh) 确定热点事件的方法、装置和存储介质以及电子设备
CN108304424A (zh) 文本关键词提取方法及文本关键词提取装置
CN109859747A (zh) 语音交互方法、设备以及存储介质
CN113450771A (zh) 唤醒方法、模型训练方法和装置
CN111128174A (zh) 一种语音信息的处理方法、装置、设备及介质
WO2022121152A1 (zh) 智能对话方法、装置、电子设备及存储介质
CN110491394A (zh) 唤醒语料的获取方法和装置
CN109934347A (zh) 扩展问答知识库的装置
CN114333768A (zh) 语音检测方法、装置、设备和存储介质
CN113221990B (zh) 信息录入方法、装置及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180223