CN106057197B

CN106057197B - 一种语音定时操作方法、装置及***

Info

Publication number: CN106057197B
Application number: CN201610355526.0A
Authority: CN
Inventors: 郑艳霞
Original assignee: Beijing Yunzhisheng Information Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Priority date: 2016-05-25
Filing date: 2016-05-25
Publication date: 2019-08-16
Anticipated expiration: 2036-05-25
Also published as: CN106057197A

Abstract

本发明公开了一种语音定时操作方法、装置及***，该方法包括：获取用户输入的语音命令信息；将所述语音命令信息转化为文字命令信息；识别所述文字命令信息中是否有数字；当有数字时，根据所述文字命令信息生成操作命令和计时命令；根据所述操作命令和计时命令执行相关操作。通过语音实现定时操作，无需按键输入，减少了操作的复杂程度，使用户能够更简单、方便、快捷的实现对各种设备的定时操作。

Description

一种语音定时操作方法、装置及***

技术领域

本发明涉及语音操作技术领域，特别涉及一种语音定时操作方法、装置及***。

背景技术

随着科学技术的发展，越来越多的智能设备在日程生活中得到广泛应用，这些智能家用设备从最初的机械操作控制发展到现在的电子操作控制，实现越来越智能化的操作控制。

但不论是最初的机械操作控制还是后来的电子操作控制，都需要用户操作按钮或按键来实现对设备的操作控制，而随着设备功能的越来越强大，需要操作的功能也越来越多，比如我们常用的微波炉、烤箱、热水器等家用设备上边的操作按钮越来越多越来越复杂，这无形中增加了用户操作的难度，不便于用户的操作，比如我们想要对设备做一个定时操作，可能需要多次操作按钮，实现所要定时的时间和功能。此外，比较多的功能通过较少的按钮实现，对于操作技能比较低的用户而言，比如老人，其学会操作比较费力。

因此现有的设备定时操作具有便利差、操作复杂，对用户操作技能要求高等不足之处。

发明内容

本发明提供一种语音定时操作方法、装置及***，用以解决现有技术中存在定时操作便利性差，操作复杂的问题，实现更方便、快捷、便于操作的定时操作。

本发明提供一种语音定时操作方法，包括：

获取用户输入的语音命令信息；

将所述语音命令信息转化为文字命令信息；

识别所述文字命令信息中是否有数字；

当有数字时，根据所述文字命令信息生成操作命令和计时命令；

根据所述操作命令和计时命令执行相关操作。

在一些可选的实施例中，根据所述文字命令信息生成操作命令和计时命令，具体包括：

将所述文字命令信息中的非数字文字与预设的操作命令词和计时命令词相匹配，当匹配成功时，根据匹配成功的操作命令词和计时命令词生成操作命令和计时命令。

在一些可选的实施例中，所述操作命令中包括当前命令和滞后命令；所述计时命令中包括滞后命令的滞后时长信息。

在一些可选的实施例中，所述生成操作命令和计时命令，具体包括：

提取所述文字命令信息中匹配成功的操作命令词和计时命令词；

判断所述操作命令词是否有对应的计时命令词或滞后操作指示词；

当判断为是时，生成滞后命令和对应的计时命令；当判断为否时，生成当前命令。

在一些可选的实施例中，所述将所述语音命令信息转化为文字命令信息，具体包括：

采用选定的声学模型和语言模型，确定与输入的语音命令信息匹配度最高的文字命令信息，得到语音命令信息对应的为文字命令信息。

在一些可选的实施例中，采用选定的声学模型和语言模型，确定与输入的语音命令信息匹配度最高的文字命令信息，具体包括：

采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率；

采用选定的声学模型确定待匹配文字发出语音命令信息这段语音的概率；

确定待匹配文字的序列本身概率与待匹配文字发出语音命令信息这段语音的概率的乘积最大的待匹配文字为语音命令信息匹配度最高的文字命令信息。

在一些可选的实施例中，所述获取用户输入的语音命令信息，具体包括：

获取用户通过本地输入接口输入的语音命令信息；或

获取用户通过远程客户端输入并通过无线通信网络发送过来的语音命令信息。

本发明实施例还提供一种语音定时操作装置，包括：

语音获取模块，用于获取用户输入的语音命令信息；

语音转换模块，用于将所述语音命令信息转化为文字命令信息；

内容识别模块，用于识别所述文字命令信息中是否有数字；当有数字时，通知命令生成模块；

命令生成模块，用于根据所述文字命令信息生成操作命令和计时命令；

操作执行模块，用于根据所述操作命令和计时命令执行相关操作。

在一些可选的实施例中，所述命令生成模块，具体用于：

在一些可选的实施例中，所述语音转换模块，具体用于：

在一些可选的实施例中，所述语音获取模块，具体用于：

获取用户通过本地输入接口输入的语音命令信息；或

本发明实施例还提供一种语音定时操作***，包括：远程客户端和定时操作设备；

所述远程客户端，用于接收用户输入的语音命令信息，通过无线通信网络发送给所述定时操作设备；

所述定时操作设备，用于获取所述远程客户端发送的所述语音命令信息；将所述语音命令信息转化为文字命令信息；识别所述文字命令信息中是否有数字；当有数字时，根据所述文字命令信息生成操作命令和计时命令；根据所述操作命令和计时命令执行相关操作。

在一些可选的实施例中，所述定时操作设备，具体用于：

本发明实施例提供的语音定时操作方法、装置及***，能够通过语音实现操作定时，无需操作按键即可实现操作，便利了用户操作，降低了定时操作的复杂程度，其实现更方便、快捷，降低了对用户操作技能的要求。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中语音定时操作方法的流程图；

图2为本发明实施例一中语音定时操作方法的流程图；

图3为本发明实施例二中语音定时操作方法的流程图；

图4为本发明实施例中语音定时操作装置的结构示意图；

图5为本发明实施例中语音定时操作***的结构示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

为了解决现有技术中的问题，本发明实施例提供一种语音定时操作方法，该方法能够允许设备通过本地输入和远程输入语音操作命令，实现对设备的语音控制。

本发明实施例提供的语音定时操作方法，其流程如图1所示，包括如下步骤：

步骤S101：获取用户输入的语音命令信息。

用户可以通过定时操作设备上设置的语音输入功能模块，输入语音命令信息。例如：定时操作设备为能够实现定时操作的燃气灶或电饭煲，用户想要实现煮半小时后自动停止，则用户可以输入语音命令信息“煮半小时后关火”。

步骤S102：将获取的语音命令信息转化为文字命令信息。

定时操作设备实现语音到文字的转换，以便识别用户输入的操作命令。沿用上边的例子，定时操作设备将用户输入的语音命令信息转化为文字命令信息“煮半小时后关火”。

针对输入的语音命令信息，找到一个与之匹配度最高的文字序列，实现语音到文字的转化，得到文字命令信息，其中匹配度可以用概率表示。例如用Y表示语音命令信息，W表示文字命令信息，则是要找到与Y匹配度最高的W。可以采用选定的声学模型和语言模型，确定与输入的语音命令信息匹配度最高的文字命令信息，得到语音命令信息对应的为文字命令信息。

步骤S103：识别转化出的文字命令信息中是否有数字。当有数字时，执行步骤S104；当没有数字时，执行步骤S106。

定时操作设备识别文字命令信息中是否有数字，尤其是时间数字。沿用上边的例子，文字命令信息中包括的数字为“半小时”。

步骤S104：根据转化出的文字命令信息生成操作命令和计时命令。

当有数字时，说明需要定时操作，则将文字信息转化为操作命令和即时命令，此时可以对文字命令信息进行分词处理，从分词后得到的词语中找出操作命令词、计时命令词，根据分词后得到的操作命令词和计时命令词生成操作命令和计时命令。

其中，操作命令中包括当前命令和滞后命令，当前命令是当前执行的命令，滞后命令是计时后执行的命令；计时命令中包括滞后命令的滞后时长信息，也可以包括当前命令的持续时长信息。通常是文字命令信息中识别出的数字。

沿用上边的例子，文字命令信息进行分词后，能够找出的操作命令词有“煮”和“关火”，计时命令词有“半小时”，还有表征滞后操作的滞后操作指示词“后”，根据分离出的这些分词之间的关联关系，比如逻辑关系，时间先后关系等，可以知道“半小时”这个计时命令词是操作命令词“关火”的滞后时长信息，也可以说是操作命令词“煮”的持续时长信息，通过“后”这样的时序词区分当前命令和滞后命令。因此，可以得到当前命令“煮”，滞后命令“关火”，表示滞后命令滞后时长信息或当前命令持续时长信息的计时命令“半小时”。

步骤S105：根据生成的操作命令和计时命令执行相关操作。

生成操作命令和计时命令后，定时操作设备可以执行生成的操作命令和计时命令，沿用上边的例子，执行当前命令“煮”和计时命令“半小时”，调节火的大小或加热温度，以满足煮的条件，持续时长为半小时；执行滞后命令“关火”和计时命令“半小时”，执行的滞后时长为半小时，从煮的处理开始计时，半小时后自动关火。

步骤S106：结束本次定时操作流程。

可选的，提示用户本次定时操作失败，请重新输入操作命令。

本发明实施例提供的技术方案，即使用户不熟悉设备的按钮或按键操作，也能方便的通过简单的语音输入实现定时操作，方便、快捷，可操作性强，操作便利。

实施例一

本发明实施例一提供一种语音定时操作的具体实现方法，其流程如图2所示，包括如下步骤：

步骤S201：获取用户通过本地输入接口输入的语音命令信息。

定时操作设备本地设置有具有语音输入功能的模块，用户可以通过本地输入接口，直接对着定时操作设备录入语音。

步骤S202：将获取的语音命令信息转化为文字命令信息。

采用选定的声学模型和语言模型，确定与输入的语音命令信息匹配度最高的文字命令信息，具体可以包括：

然后可以得到语音命令信息对应的为文字命令信息。

步骤S203：识别转化出的文字命令信息中是否有数字。

当有数字时，执行步骤S204；当没有数字时，执行步骤S207。

步骤S204：将转化出的文字命令信息中的非数字文字与预设的操作命令词和计时命令词相匹配。

可以预先在本地设置操作命令词和计时命令词词库，将语音命令信息转化为文字命令信息之后，可以将分词后得到的其中的非数字部分与存储的操作命令词和计时命令词进行匹配，以便确认文字命令信息中是否包括操作命令词和计时命令词。

当匹配成功时，执行步骤S205；未匹配成功时，执行步骤S207。

步骤S205：根据匹配成功的操作命令词和计时命令词生成操作命令和计时命令。

当匹配成功时，可以生成相应的操作命令和计时命令。

步骤S206：根据生成的操作命令和计时命令执行相关操作。

步骤S207：结束本次定时操作流程。

实施例二

本发明实施例二提供一种语音定时操作的具体实现方法，其流程如图3所示，包括如下步骤：

步骤S301：用户通过远程客户端输入语音命令信息。

这种情况适用于用户的远程操作，例如用户不在家或不再定时操作设备跟前时，也能方便的进行定时操作，通过远程客户端，例如移动终端等设备实现语音命令信息的输入。

步骤S302：远程客户端将输入的语音命令信息发送给定时操作设备。

远程客户端，例如移动终端可以通过无线通信网络与定时设备建立通信连接，将用户输入的语音命令信息发送给定时操作设备。

步骤S303：定时操作设备获取远程客户端发送过来的语音命令信息。

定时操作设备获取用户通过远程客户端输入并通过无线通信网络发送过来的语音命令信息，实现远程定时操作的命令的获取。

步骤S304：将获取的语音命令信息转化为文字命令信息。

步骤S305：识别转化出的文字命令信息中是否有数字。

当有数字时，执行步骤S306；当没有数字时，执行步骤S312。

步骤S306：将转化出的文字命令信息中的非数字文字与预设的操作命令词和计时命令词相匹配。

当匹配成功时，执行步骤S307；当没有匹配成功时，执行步骤S312。

步骤S307：提取文字命令信息中匹配成功的操作命令词和计时命令词。

将文字命令信息中匹配成功的操作命令词和计时命令词作为省城操作命令和即时命令的关键词，以便生成对应的操作命令和计时命令。

步骤S308：判断操作命令词是否有对应的计时命令词或滞后操作指示词。若是，执行步骤S309；若否，执行步骤S310。

根据操作命令是否有对应的滞后操作标识词，来确定生成当前命令还是滞后命令。此处通过判断操作命令词是否有对应的计时命令词或滞后操作指示词，是否需要生成滞后命令，对于有相关联的预先存储的滞后操作指示词和/或计时命令词的操作命令词，可以生成滞后命令，否则生成当前命令。

步骤S309：生成滞后命令和对应的计时命令。

例如，沿用上边的例子，对于有关联的滞后操作指示词“后”才执行的操作命令“关火”，生成滞后命令和对应的计时命令。

步骤S310：生成当前命令。

上述步骤306-步骤S310实现了根据匹配成功的操作命令词和计时命令词生成操作命令和计时命令。

步骤S311：根据生成的操作命令和计时命令执行相关操作。

步骤S312：结束本次定时操作流程。

本发明实施例提供的技术方案，可以实现远程的定时操作，更方便了用户实现对定时操作设备的定时操作。

基于同一发明构思，本发明实施例还提供一种语音定时操作装置，其结构如图4所示，包括：语音获取模块401、语音转换模块402、内容识别模块403、命令生成模块404和操作执行模块405。

语音获取模块401，用于获取用户输入的语音命令信息。

语音转换模块402，用于将输入的语音命令信息转化为文字命令信息。

内容识别模块403，用于识别转化出的文字命令信息中是否有数字；当有数字时，通知命令生成模块404。

命令生成模块404，用于根据转化出的文字命令信息生成操作命令和计时命令。

操作执行模块405，用于根据生成的操作命令和计时命令执行相关操作。

优选的，上述命令生成模块404，具体用于将文字命令信息中的非数字文字与预设的操作命令词和计时命令词相匹配，当匹配成功时，根据匹配成功的操作命令词和计时命令词生成操作命令和计时命令。

优选的，上述命令生成模块404，具体用于提取文字命令信息中匹配成功的操作命令词和计时命令词；判断提取的操作命令词是否有对应的计时命令词或滞后操作指示词；当判断为是时，生成滞后命令和对应的计时命令；当判断为否时，生成当前命令。

优选的，上述语音转换模块402，具体用于采用选定的声学模型和语言模型，确定与输入的语音命令信息匹配度最高的文字命令信息，得到语音命令信息对应的为文字命令信息。

优选的，上述语音转换模块402，具体用于采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率；采用选定的声学模型确定待匹配文字发出语音命令信息这段语音的概率；确定待匹配文字的序列本身概率与待匹配文字发出语音命令信息这段语音的概率的乘积最大的待匹配文字为语音命令信息匹配度最高的文字命令信息。

优选的，上述语音获取模块401，具体用于获取用户通过本地输入接口输入的语音命令信息；或获取用户通过远程客户端输入并通过无线通信网络发送过来的语音命令信息。

基于同一发明构思，针对远程输入语音操作命令的情况，本发明实施例还提供一种语音定时操作***，该***结构如图5所示，包括：远程客户端501和定时操作设备502。

远程客户端501，用于接收用户输入的语音命令信息，通过无线通信网络发送给定时操作设备502。

定时操作设备502，包括如图4所示的语音定时操作装置，可以获取用户通过远程客户端输入并通过无线通信网络发送过来的语音命令信息。定时操作设备502，用于获取远程客户端发送的用户输入的语音命令信息；将输入的语音命令信息转化为文字命令信息；识别转化出的文字命令信息中是否有数字；当有数字时；根据转化出的文字命令信息生成操作命令和计时命令；根据生成的操作命令和计时命令执行相关操作。

优选的，上述定时操作设备502，具体用于将文字命令信息中的非数字文字与预设的操作命令词和计时命令词相匹配，当匹配成功时，根据匹配成功的操作命令词和计时命令词生成操作命令和计时命令。

优选的，上述定时操作设备502，具体用于提取文字命令信息中匹配成功的操作命令词和计时命令词；判断操作命令词是否有对应的计时命令词或滞后操作指示词；当判断为是时，生成滞后命令和对应的计时命令；当判断为否时，生成当前命令。

优选的，上述定时操作设备502，具体用于采用选定的声学模型和语言模型，确定与输入的语音命令信息匹配度最高的文字命令信息，得到语音命令信息对应的为文字命令信息。

优选的，上述定时操作设备502，具体用于采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率；采用选定的声学模型确定待匹配文字发出语音命令信息这段语音的概率；确定待匹配文字的序列本身概率与待匹配文字发出语音命令信息这段语音的概率的乘积最大的待匹配文字为语音命令信息匹配度最高的文字命令信息。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种语音定时操作方法，其特征在于，包括：

获取用户输入的语音命令信息；

将所述语音命令信息转化为文字命令信息；

识别所述文字命令信息中是否有数字；所述数字包括时间数字；

根据所述操作命令和计时命令执行相关操作；

其中，根据所述文字命令信息生成操作命令和计时命令，具体包括：

将所述文字命令信息中的非数字文字与预设的操作命令词和计时命令词相匹配，当匹配成功时，根据匹配成功的操作命令词和计时命令词生成操作命令和计时命令；所述操作命令中包括当前命令和滞后命令；所述计时命令中包括滞后命令的滞后时长信息或者当前命令的持续时长时间。

2.如权利要求1所述的方法，其特征在于，所述生成操作命令和计时命令，具体包括：

3.如权利要求1所述的方法，其特征在于，所述将所述语音命令信息转化为文字命令信息，具体包括：

4.如权利要求3所述的方法，其特征在于，采用选定的声学模型和语言模型，确定与输入的语音命令信息匹配度最高的文字命令信息，具体包括：

5.如权利要求1-4任一所述的方法，其特征在于，所述获取用户输入的语音命令信息，具体包括：

获取用户通过本地输入接口输入的语音命令信息；或

6.一种语音定时操作装置，其特征在于，包括：

语音获取模块，用于获取用户输入的语音命令信息；

内容识别模块，用于识别所述文字命令信息中是否有数字；当有数字时，通知命令生成模块；所述数字包括时间数字；

操作执行模块，用于根据所述操作命令和计时命令执行相关操作；

其中，所述命令生成模块，具体用于：

7.如权利要求6所述的装置，其特征在于，所述命令生成模块，具体用于：

8.如权利要求6所述的装置，其特征在于，所述语音转换模块，具体用于：

9.如权利要求8所述的装置，其特征在于，所述语音转换模块，具体用于：

10.如权利要求6-9任一所述的装置，其特征在于，所述语音获取模块，具体用于：

获取用户通过本地输入接口输入的语音命令信息；或

11.一种语音定时操作***，其特征在于，包括：远程客户端和定时操作设备；

所述定时操作设备，用于获取所述远程客户端发送的所述语音命令信息；将所述语音命令信息转化为文字命令信息；识别所述文字命令信息中是否有数字；当有数字时，根据所述文字命令信息生成操作命令和计时命令；根据所述操作命令和计时命令执行相关操作；所述数字包括时间数字；

其中，所述定时操作设备，具体用于：

12.如权利要求11所述的***，其特征在于，所述定时操作设备，具体用于：

13.如权利要求11任一所述的***，其特征在于，所述定时操作设备，具体用于：

14.如权利要求13所述的***，其特征在于，所述定时操作设备，具体用于：