CN109377991B

CN109377991B - 一种智能设备控制方法及装置

Info

Publication number: CN109377991B
Application number: CN201811163447.5A
Authority: CN
Inventors: 王慧君; 张新; 毛跃辉; 廖湖锋; 廖海霖; 邹其琛; 李保水; 文皓
Original assignee: Gree Electric Appliances Inc of Zhuhai
Current assignee: Gree Electric Appliances Inc of Zhuhai
Priority date: 2018-09-30
Filing date: 2018-09-30
Publication date: 2021-07-23
Anticipated expiration: 2038-09-30
Also published as: CN109377991A

Abstract

本发明提供了一种智能设备控制方法及装置，其中，该方法包括：通过默认的远场识别模型采集并识别用户发出的第一语音控制指令；根据识别的结果确定所述用户所在位置，在所述智能设备当前与所述用户所在位置的距离大于第一预设值的情况下，控制所述智能设备向所述用户移动；在所述智能设备与所述用户所在位置的距离小于第二预设值的情况下，将所述远场识别模型切换为近场识别模型，通过本发明，解决了相关技术中嘈杂环境的噪音干扰导致智能设备对语音接收和识别的效果不佳的问题，根据远场识别模型采集的语音对声源进行定位，向声源位置靠近，切换为近场识别模型，提高了智能设备在嘈杂环境中的识别效果。

Description

一种智能设备控制方法及装置

技术领域

本发明涉及通信领域，具体而言，涉及一种智能设备控制方法及装置。

背景技术

基于耳机的语音控制方法和装置避免了外界噪音对语音控制的干扰。但是这种方法需要客户额外购置耳机设备，且需要在佩戴情况下使用，不具有智能性和便捷性。

目前的语音控制方式由于周边环境的嘈杂和噪音，会对语音接收和识别产生较大的影响，降低语音识别的准确性，影响后续的响应操作。

针对相关技术中嘈杂环境的噪音干扰导致智能设备对语音接收和识别的效果不佳的问题，尚未提出解决方案。

发明内容

本发明实施例提供了一种智能设备控制方法及装置，以至少解决相关技术中嘈杂环境的噪音干扰导致智能设备对语音接收和识别的效果不佳的问题。

根据本发明的一个实施例，提供了一种智能设备控制方法，包括：

通过默认的远场识别模型实时监测并采集用户向智能设备发出的第一语音控制指令，并对所述第一语音控制指令进行语音识别；

根据识别的结果确定所述用户所在位置，判断所述智能设备当前与所述用户所在位置的距离是否大于第一预设值；

在判断结果为是的情况下，控制所述智能设备向所述用户移动；

在所述智能设备向所述用户移动过程中实时检测所述智能设备与所述用户所在位置的距离；

在所述智能设备与所述用户所在位置的距离小于第二预设值的情况下，将所述远场识别模型切换为近场识别模型。

可选地，控制所述智能设备向所述用户移动包括：

确定从所述智能设备到预定位置的移动路径，其中，所述预定位置与所述用户所在位置之间的距离为第一距离阈值；

控制所述智能设备根据所述移动路径移动到所述预定位置。

可选地，确定从所述智能设备到预定位置的移动路径包括：

根据采集的所述第一语音控制指令，通过声源定位确定所述用户所在位置；

确定所述智能设备相对于所述用户所在位置的距离及方向；

根据所述智能设备所在位置、所述第一距离阈值以及所述智能设备相对于所述用户所在位置的距离及方向确定所述预定位置；

通过室内导航生成以所述智能设备当前位置的坐标为起点，以所述预定位置对应的位置坐标为终点的所述移动路径。

可选地，控制所述智能设备根据所述移动路径移动到所述预定位置包括：

实时控制所述智能设备按照所述移动路径并以预设的固定步长移动到所述预定位置。

可选地，在将所述远场识别模型切换为近场识别模型之后，所述方法还包括：

通过所述近场识别模型监测到用户发出第二语音控制指令；

采集并识别所述第二语音控制指令的同时，停止移动；

根据识别的结果确定所述用户当前所在位置，判断所述智能设备当前与所述用户当前所在位置的距离是否大于所述第二预设值；在判断结果为是的情况下，将所述近场识别模型切换为所述远场识别模型。

可选地，对采集的所述第一语音控制指令进行语音识别包括：

从所述第一语音控制指令中识别出唤醒词；

根据所述唤醒词确定对所述智能设备执行移动操作。

根据本发明的另一个实施例，还提供了一种智能设备控制装置，包括：

语音采集识别模块，用于通过默认的远场识别模型实时监测并采集用户向智能设备发出的第一语音控制指令，并对所述第一语音控制指令进行语音识别；

第一判断模块，用于根据识别的结果确定所述用户所在位置，判断所述智能设备当前与所述用户所在位置的距离是否大于第一预设值；

控制模块，用于在判断结果为是的情况下，控制所述智能设备向所述用户移动；

检测模块，用于在所述智能设备向所述用户移动过程中实时检测所述智能设备与所述用户所在位置的距离；

第一切换模块，用于在所述智能设备与所述用户所在位置的距离小于第二预设值的情况下，将所述远场识别模型切换为近场识别模型。

可选地，所述控制模块包括：

确定单元，用于确定从所述智能设备到预定位置的移动路径，其中，所述预定位置与所述用户所在位置之间的距离为第一距离阈值；

控制单元，用于控制所述智能设备根据所述移动路径移动到所述预定位置。

可选地，所述确定单元，还用于

确定所述智能设备相对于所述用户所在位置的距离及方向；

可选地，所述控制单元，还用于

可选地，所述装置还包括：

监测模块，用于通过所述近场识别模型监测到用户发出第二语音控制指令；

停止模块，用于采集并识别所述第二语音控制指令的同时，停止移动；

第二判断模块，用于根据识别的结果确定所述用户当前所在位置，判断所述智能设备当前与所述用户当前所在位置的距离是否大于所述第二预设值；

第二切换模块，用于在判断结果为是的情况下，将所述近场识别模型切换为所述远场识别模型。

可选地，所述语音采集识别模块包括：

识别单元，用于从所述第一语音控制指令中识别出唤醒词；

执行单元，用于根据所述唤醒词确定对所述智能设备执行移动操作。

根据本发明的又一个实施例，还提供了一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本发明的又一个实施例，还提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本发明，由于通过默认的远场识别模型实时监测并采集用户向智能设备发出的第一语音控制指令，并对所述第一语音控制指令进行语音识别；根据识别的结果确定所述用户所在位置，判断所述智能设备当前与所述用户所在位置的距离是否大于第一预设值；在判断结果为是的情况下，控制所述智能设备向所述用户移动；在所述智能设备向所述用户移动过程中实时检测所述智能设备与所述用户所在位置的距离；在所述智能设备与所述用户所在位置的距离小于第二预设值的情况下，将所述远场识别模型切换为近场识别模型，因此，可以解决相关技术中嘈杂环境的噪音干扰导致智能设备对语音接收和识别的效果不佳的问题，距离较远采用远场识别模型，根据采集的语音对声源进行定位，控制智能设备向声源位置靠近，较近时采用近场识别模型，提高了智能设备在嘈杂环境中的识别效果，达到提高用户体验的效果。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例的一种智能设备控制方法的移动终端的硬件结构框图；

图2是根据本发明实施例的一种智能设备控制方法的流程图；

图3是根据本发明实施例的智能设备控制装置的框图；

图4是根据本发明优选实施例的智能设备控制装置的框图一；

图5是根据本发明优选实施例的智能设备控制装置的框图二。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例，图1是本发明实施例的一种智能设备控制方法的移动终端的硬件结构框图，如图1所示，移动终端10可以包括三个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104，可选地，上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述移动终端的结构造成限定。例如，移动终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的报文接收方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

基于上述的移动终端，本实施例中提供了一种智能设备控制方法，图2是根据本发明实施例的一种智能设备控制方法的流程图，如图2所示，该流程包括如下步骤：

步骤S202，通过默认的远场识别模型实时监测并采集用户向智能设备发出的第一语音控制指令，并对所述第一语音控制指令进行语音识别；

步骤S204，根据识别的结果确定所述用户所在位置，判断所述智能设备当前与所述用户所在位置的距离是否大于第一预设值；

步骤S206，在判断结果为是的情况下，控制所述智能设备向所述用户移动；

步骤S208，在所述智能设备向所述用户移动过程中实时检测所述智能设备与所述用户所在位置的距离；

步骤S210，在所述智能设备与所述用户所在位置的距离小于第二预设值的情况下，将所述远场识别模型切换为近场识别模型。

通过上述步骤，解决了相关技术中嘈杂环境的噪音干扰导致智能设备对语音接收和识别的效果不佳的问题，距离较远采用远场识别模型，根据采集的语音对声源进行定位，控制智能设备向声源位置靠近，较近时采用近场识别模型，提高了智能设备在嘈杂环境中的识别效果，达到提高用户体验的效果。

本发明实施例中，根据声源和麦克风阵列距离的远近，可将声场模型分为两种：近场识别模型和远场识别模型。近场识别模型将声波看成球面波，它考虑麦克风阵元接收信号间的幅度差；远场识别模型则将声波看成平面波，它忽略各阵元接收信号间的幅度差，近似认为各接收信号之间是简单的时延关系。近场识别模型和远场识别模型的划分没有绝对的标准，一般认为声源离麦克风阵列中心参考点的距离远大于信号波长时为远场；反之，则为近场。设均匀线性阵列相邻阵元之间的距离(又称阵列孔径)为D＝n*d，n为阵列间距个数，一般是M-1；声源最高频率语音的波长(即声源的最小波长)为λmin，如果声源到阵列中心的距离大于2D2/λmin，则为远场识别模型，否则为近场识别模型。

本发明实施例中，控制所述智能设备向所述用户移动具体可以包括：确定从所述智能设备到预定位置的移动路径，其中，所述预定位置与所述用户所在位置之间的距离为第一距离阈值；控制所述智能设备根据所述移动路径移动到所述预定位置。进一步地，确定从所述智能设备到预定位置的移动路径包括：根据采集的所述第一语音控制指令，通过声源定位确定所述用户所在位置；确定所述智能设备相对于所述用户所在位置的距离及方向；根据所述智能设备所在位置、所述第一距离阈值以及所述智能设备相对于所述用户所在位置的距离及方向确定所述预定位置；通过室内导航生成以所述智能设备当前位置的坐标为起点，以所述预定位置对应的位置坐标为终点的所述移动路径。进一步地，控制所述智能设备根据所述移动路径移动到所述预定位置具体可以包括：实时控制所述智能设备按照所述移动路径并以预设的固定步长移动到所述预定位置。

本发明实施例中，若在移动过程中，检测到用户再次发起语音信号，则停止移动，具体地，在将所述远场识别模型切换为近场识别模型之后，通过所述近场识别模型监测到用户发出第二语音控制指令；采集并识别所述第二语音控制指令的同时，停止移动；根据识别的结果确定所述用户当前所在位置，判断所述智能设备当前与所述用户当前所在位置的距离是否大于所述第二预设值；在判断结果为是的情况下，将所述近场识别模型切换为所述远场识别模型。

通过对用户发出的语音信号进行识别，当语音识别结果不理想时，控制智能设备朝向用户移动，缩短用户与智能设备的距离，当移动到与用户相距较近的位置后，再次对用户发出的语音信号进行识别(如，识别用户发出的命令词)从而实现了在识别效果不好的情况下，控制设备移动到说话人近前，进行近场语音识别，弥补了远场语音识别效果差的缺点。并且，只需用户发出一次语音指令，即可同时完成唤醒、指令识别和定位移动功能，优化了用户体验。

本发明实施例中，对采集的所述第一语音控制指令进行语音识别具体可以包括：从所述第一语音控制指令中识别出唤醒词；根据所述唤醒词确定对所述智能设备执行移动操作。唤醒智能设备的相应功能可以是唤醒智能设备的语音交互功能，实际应用过程中，智能设备在没有用户和其对话的时候，可以处于休眠/待机状态以节省功耗，并且智能设备中可以设置麦克风阵列，用来实时监测并采集智能设备用户发出的语音信号。

本发明实施例通过麦克风阵列采集用户发出的语音，通过语音对用户进行定位，携带麦克风阵列的智能扫地机器人在根据用户发出的语音定位用户所在位置之后，自动进行用户追踪，在距离用户所在位置大于预定距离的情况下，触发向用户移动。当移动到与用户所在位置的距离小于预定距离时，采用近场识别模型采集语音信号，放大目标控制语音，在相同语音硬件设备条件下，语音采集更纯净，噪音源更小，识别效果准确。并可基于控制语音声源定位切换远近场语音识别装置，当再次检测到用户发出语音信号，采集并识别，确定用户所在位置，若此时距离用户所在位置的距离大于预定阈值，则切换为远场识别模型采集语音信号。由于采用了携带麦克风阵列的智能扫地机器人语音控制，可定位追踪用户位置，减少语音采集装置到语音信号的距离，减少语音噪音干扰，减少语音传递过程中的波形衰减。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

在本实施例中还提供了一种智能设备控制装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图3是根据本发明实施例的智能设备控制装置的框图，如图3所示，包括：

语音采集识别模块32，用于通过默认的远场识别模型实时监测并采集用户向智能设备发出的第一语音控制指令，并对所述第一语音控制指令进行语音识别；

第一判断模块34，用于根据识别的结果确定所述用户所在位置，判断所述智能设备当前与所述用户所在位置的距离是否大于第一预设值；

控制模块36，用于在判断结果为是的情况下，控制所述智能设备向所述用户移动；

检测模块38，用于在所述智能设备向所述用户移动过程中实时检测所述智能设备与所述用户所在位置的距离；

第一切换模块310，用于在所述智能设备与所述用户所在位置的距离小于第二预设值的情况下，将所述远场识别模型切换为近场识别模型。

图4是根据本发明优选实施例的智能设备控制装置的框图一，如图4所示，所述控制模块36包括：

确定单元42，用于确定从所述智能设备到预定位置的移动路径，其中，所述预定位置与所述用户所在位置之间的距离为第一距离阈值；

控制单元44，用于控制所述智能设备根据所述移动路径移动到所述预定位置。

可选地，所述确定单元42，还用于

确定所述智能设备相对于所述用户所在位置的距离及方向；

可选地，所述控制单元44，还用于

可选地，所述装置还包括：

图5是根据本发明优选实施例的智能设备控制装置的框图二，如图5所示，所述语音采集识别模块32包括：

识别单元52，用于从所述第一语音控制指令中识别出唤醒词；

执行单元54，用于根据所述唤醒词确定对所述智能设备执行移动操作。

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

本发明的实施例还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S11，通过默认的远场识别模型实时监测并采集用户向智能设备发出的第一语音控制指令，并对所述第一语音控制指令进行语音识别；

S12，根据识别的结果确定所述用户所在位置，判断所述智能设备当前与所述用户所在位置的距离是否大于第一预设值；

S13，在判断结果为是的情况下，控制所述智能设备向所述用户移动；

S14，在所述智能设备向所述用户移动过程中实时检测所述智能设备与所述用户所在位置的距离；

S15，在所述智能设备与所述用户所在位置的距离小于第二预设值的情况下，将所述远场识别模型切换为近场识别模型。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

实施例4

本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种智能设备控制方法，其特征在于，包括：

在所述智能设备与所述用户所在位置的距离小于第二预设值的情况下，将所述远场识别模型切换为近场识别模型；

其中，控制所述智能设备向所述用户移动包括：确定从所述智能设备到预定位置的移动路径，其中，所述预定位置与所述用户所在位置之间的距离为第一距离阈值；控制所述智能设备根据所述移动路径移动到所述预定位置；

在将所述远场识别模型切换为近场识别模型之后，所述方法还包括：通过所述近场识别模型监测到用户发出第二语音控制指令；采集并识别所述第二语音控制指令的同时，停止移动；根据识别的结果确定所述用户当前所在位置，判断所述智能设备当前与所述用户当前所在位置的距离是否大于所述第二预设值；在判断结果为是的情况下，将所述近场识别模型切换为所述远场识别模型；

其中，声源最高频率语音的最小波长为λmin，如果声源到阵列中心的距离大于2D²/λmin，则为所述远场识别模型，否则为所述近场识别模型。

2.根据权利要求1所述的方法，其特征在于，确定从所述智能设备到预定位置的移动路径包括：

确定所述智能设备相对于所述用户所在位置的距离及方向；

3.根据权利要求1所述的方法，其特征在于，控制所述智能设备根据所述移动路径移动到所述预定位置包括：

4.根据权利要求1至3中任一项所述的方法，其特征在于，对采集的所述第一语音控制指令进行语音识别包括：

从所述第一语音控制指令中识别出唤醒词；

根据所述唤醒词确定对所述智能设备执行移动操作。

5.一种智能设备控制装置，其特征在于，包括：

第一切换模块，用于在所述智能设备与所述用户所在位置的距离小于第二预设值的情况下，将所述远场识别模型切换为近场识别模型；

其中，所述控制模块包括：确定单元，用于确定从所述智能设备到预定位置的移动路径，其中，所述预定位置与所述用户所在位置之间的距离为第一距离阈值；控制单元，用于控制所述智能设备根据所述移动路径移动到所述预定位置；

所述装置还包括：监测模块，用于通过所述近场识别模型监测到用户发出第二语音控制指令；停止模块，用于采集并识别所述第二语音控制指令的同时，停止移动；第二判断模块，用于根据识别的结果确定所述用户当前所在位置，判断所述智能设备当前与所述用户当前所在位置的距离是否大于所述第二预设值；第二切换模块，用于在判断结果为是的情况下，将所述近场识别模型切换为所述远场识别模型；

6.一种存储介质，其特征在于，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至4任一项中所述的方法。

7.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行所述权利要求1至4任一项中所述的方法。