WO2016082344A1

WO2016082344A1 - 一种语音控制的方法、装置及存储介质

Info

Publication number: WO2016082344A1
Application number: PCT/CN2015/072705
Authority: WO
Inventors: 魏占婷
Original assignee: 中兴通讯股份有限公司
Priority date: 2014-11-25
Filing date: 2015-02-10
Publication date: 2016-06-02
Also published as: CN105611033A

Abstract

本发明提供一种语音控制的方法、装置及存储介质，应用于终端侧的方法包括：获取用户的输入语音；若所述终端侧开启预设功能，确定所述终端侧是否预先存储有与所述输入语音一致的标识语音；若存在所述标识语音，根据所述标识语音，获取预先设置的与所述标识语音的含义不相关的预设信息；执行所述预设信息对应的操作。

Description

一种语音控制的方法、装置及存储介质

技术领域

本发明涉及通信技术领域，特别涉及一种语音控制的方法、装置及存储介质。

背景技术

手机已成为人们日常生活中形影不离的工具，手机使用安全性显得越来越重要，语音输入使用的频率越来越多，目前市面上的语音输入是终端识别用户语音后，对用户实际的语音含义复述或显示。例如利用Siri(苹果公司推出的一项语音控制功能)用户可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等；Siri可以支持自然语言输入，并且可以调用***自带的天气预报、日程安排、搜索资料等应用，还能够不断学习新的声音和语调，提供对话式的应答。但是，由于现有技术中的语音输入是控制终端执行语音输入的实际含义，该种方法容易被其他用户轻易获知其目的，例如发生危险情况时，用户须发出“拨打110”的声音，终端才能自动拨打110；但是此时用户发出“拨打110”的声音后，别人就知道了该用户的意图，可以立即对其进行阻断，切断终端拨打110的操作，从而影响用户实施自救等等。综上，终端根据用户发出声音的直接含义进行操作的方法缺乏安全性，其他用户能够较容易获取用户意图，从而影响用户操作。

发明内容

为解决现有存在的技术问题，本发明实施例主要期望提供一种语音控制的方法、装置及存储介质。

本发明实施例提供一种语音控制的方法，应用于终端侧，该方法包括：

获取用户的输入语音；

若所述终端侧开启预设功能，确定所述终端侧是否预先存储有与所述输入语音一致的标识语音；

若存在所述标识语音，根据所述标识语音，获取预先设置的与所述标识语音的含义不相关的预设信息；

执行所述预设信息对应的操作。

本发明实施例还提供一种语音控制的装置，应用于终端侧，该装置包括：语音获取模块、确定模块、预设信息获取模块、第一执行模块；其中，

语音获取模块，配置为获取用户的输入语音；

确定模块，配置为若所述终端侧开启预设功能，确定所述终端侧是否预先存储有与所述输入语音一致的标识语音；

预设信息获取模块，配置为若存在所述标识语音，根据所述标识语音，获取预先设置的与所述标识语音的含义不相关的预设信息；

第一执行模块，配置为执行所述预设信息对应的操作。

本发明实施例还提供一种终端，该终端包括处理器，所述处理器，配置为获取用户的输入语音；若所述终端侧开启预设功能，确定所述终端侧是否预先存储有与所述输入语音一致的标识语音；若存在所述标识语音，根据所述标识语音，获取预先设置的与所述标识语音的含义不相关的预设信息；执行所述预设信息对应的操作。

本发明实施例还提供一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行上述的语音控制的方法。

本发明的上述技术方案至少具有如下有益效果：

本发明实施例的语音控制的方法、装置及存储介质中，通过获取用户的输入语音后与终端侧预先存储的标识语音相匹配，匹配一致后获取与标识语音的含义不相关的预设信息，从而所述终端执行预设信息对应的操作；本发明实施例中通过预先设置的与标识语音的含义不相关的预设信息使得其他用户无法直接获取用户的真实意图，实现了个性化的语音控制设置，大大提高了终端语音输入的安全性和服务性；同时提高了用户满意度。

附图说明

图1表示本发明实施例的语音控制的方法的基本步骤流程图；

图2表示本发明实施例的语音控制的方法中设置预设信息的方法的基本步骤流程图；

图3表示本发明实施例的语音控制的装置的结构示意图；

图4表示本发明实施例的语音控制的装置的具体结构的连接关系示意图；

图5表示本发明的具体实施例一的执行流程图；

图6表示本发明的具体实施例二的执行流程图；

图7表示本发明的具体实施例三的执行流程图；

图8表示本发明的具体实施例四的执行流程图；

图9表示本发明的具体实施例五的执行流程图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

本发明针对现有技术中终端的语音控制方式安全性不高的问题，提供一种语音控制的方法及装置，通过获取用户的输入语音后与终端侧预先存储的标识语音相匹配，匹配一致后获取与标识语音的含义不相关的预设信息，从而所述终端执行预设信息对应的操作；本发明实施例中通过预先设置的与标识语音的含义不相关的预设信息使得其他用户无法直接获取用户的真实意图，实现了个性化的语音控制设置，大大提高了终端语音输入的安全性和服务性；同时提高了用户满意度。

如图1所示，本发明实施例提供一种语音控制的方法，应用于终端侧，包括：

步骤11，获取用户的输入语音；

步骤12，若所述终端侧开启预设功能，确定所述终端侧是否预先存储有与所述输入语音一致的标识语音；

步骤13，若存在所述标识语音，根据所述标识语音，获取预先设置的与所述标识语音的含义不相关的预设信息；

步骤14，执行所述预设信息对应的操作。

本发明的上述实施例中，用户的输入语音即为用户发出的声音，具体的，终端上设置有一人机接口模块，该人机接口模块是检测收集用户声音的接口，并用于将收集到的声音传递至终端的中央处理器；由终端侧的中央处理器执行步骤12及步骤13，即解析用户的输入语音，并调用与用户的输入语音一致的标识语音对应的预设信息，其中，为了保障输入语音的安全性，该预设信息与标识语音的含义不相关。

较佳的，如图2所示，所述预先设置的与所述标识语音的含义不相关的预设信息的具体设置步骤包括：

步骤21，获取所述用户通过预设接口输入的预设信息，所述预设信息用于指示所述终端执行相应操作；

步骤22，响应所述用户通过语音接口输入语音的操作，将输入的所述语音设置为所述预设信息设置的标识语音；其中，所述预设信息和所述标识语音的内容不相关。

本发明的上述实施例中，预设信息即为用户实际想让终端执行的操作内容，该预设信息需要用户通过预设接口自定义，其中，预设接口主要包括输入文本的接口、输入语音的接口以及调用指令的接口。同时，本发明实施例提供的语音控制的设置方法中用户需通过语音接口为所述预设信息设置标识语音，该标识语音与预设信息为一一对应的关系；即终端检测用户语音，若用户语音为标识语音中的一种，则获取标识语音对应的预设信息，终端则执行上述预设信息对应的操作。本发明实施例提供的设置方法使得终端不是直接根据用户语音的实际含义执行操作，提高了终端的语音控制方法的安全性。

具体的，本发明具体实施例中，当预设接口为输入文本接口时，步骤11具体为：

步骤211，获取所述用户通过输入文本接口输入的文本。

或者，当预设接口为输入语音接口时，步骤11具体为：

步骤212，获取所述用户通过输入语音接口输入的语音。

或者，当预设接口为调用指令接口时，步骤11具体为：

步骤213，获取用户预先设置的指令；

步骤214，获取所述用户通过调用指令接口从所述预先设置的指令中选择的指令。

本发明实施例的具体应用中，终端侧的输入文本的接口为用户界面UI上的文本输入模式；输入语音的接口为用户界面UI上的语音输入模式；调用指令的接口为用户界面UI上的指令输入模式；具体的，终端可自定义“文本、指令、语音输入”的使用场景，例如，在终端所有编辑界面，可以启动文本输入；在软件聊天工具对话界面可以启动文本及语音输入；在浏览网页可以启动“翻页、退出”等指令输入。

例如，若用户选择自定义“文本输入”：

1.提供用户输入文本的接口，比如用户可以输入“我在家呢”；

2.为用户提供定义语音的接口，为“我在家呢”定义“yes”等语音，可以录制用户声音或用户定义的其他声音；

3.在终端的任何编辑界面，手机检测到与定义的语音“yes”一致的语音，自动在编辑框内输入文本“我在家呢”。

若用户选择自定义“语音输入”：

1.提供用户输入语音的接口，比如用户输入语音“试验成功”；

2.为用户提供自定义语音的接口，为“试验成功”定义“yes”等语音，可以录制用户声音或用户定义的其他声音；

3.在互动聊天界面，手机检测到与定义的语音“yes”一致的语音，自动发送语音“试验成功”。

若用户选择自定义“指令输入”：

1.首先自定义一些指令，并提供用户调用指令的接口，比如定义“网页翻页”指令；

2.用户选择网页翻页指令，为“网页翻页”定义“翻页”等语音，可以录制用户声音或用户定义的其他声音；

3.在浏览器界面或文档阅读界面，手机检测到与定义的语音“翻页”一致的语音，网页或文档会自动翻页。

需要说明的是，本发明实施例提供语音控制的方法在终端中设置时还设置一配置开关，即打开上述配置开关该方法才能生效，若该配置开关关闭，则终端能够正常识别用户语音，并执行与用户语音的实际含义对应的操作，该配置开关的设置使得终端原有功能不受影响。该配置方法实现了自定义语音输入的方法，大大提高终端的安全性。

具体的，若所述终端侧未开启所述预设功能，所述方法还包括：

步骤31，解析所述输入语音，确定所述输入语音的含义；

步骤32，根据所述输入语音的含义，执行对应操作。

本发明实施例的预设信息的设置方法中，用户通过预设接口输入实际需执行内容(预设信息)，并通过语音接口为实际需执行内容设置标识语音，则终端检测到标识语音后对应需执行上述预设信息对应的实际需执行内容，实现了个性化的语音控制设置，大大提高了终端语音输入的安全性和服务性；同时提高了用户满意度。

为了更好的实现上述方法，如图3所示，本发明实施例还提供一种语音控制的装置，应用于终端侧，包括：

语音获取模块301，配置为获取用户的输入语音；

确定模块302，配置为若所述终端侧开启预设功能，确定所述终端侧是否预先存储有与所述输入语音一致的标识语音；

预设信息获取模块303，配置为若存在所述标识语音，根据所述标识语音，获取预先设置的与所述标识语音的含义不相关的预设信息；

第一执行模块304，配置为执行所述预设信息对应的操作。

具体的，本发明上述实施例中，若所述终端侧未开启所述预设功能，所述装置还包括：

解析模块，配置为解析所述输入语音，确定所述输入语音的含义；

第二执行模块，配置为根据所述输入语音的含义，执行对应操作。

具体的，本发明上述实施例中，所述装置还包括：

获取模块，配置为获取所述用户通过预设接口输入的预设信息，所述预设信息用于指示所述终端执行相应操作；

设置模块，配置为响应所述用户通过语音接口输入语音的操作，将输入的所述语音设置为所述预设信息设置的标识语音；其中，所述预设信息和所述标识语音的内容不相关。

具体的，本发明上述实施例中，所述获取模块包括：

第一获取子模块，配置为获取所述用户通过输入文本接口输入的文本。

具体的，本发明上述实施例中，所述获取模块包括：

第二获取子模块，配置为获取所述用户通过输入语音接口输入的语音。

具体的，本发明上述实施例中，所述获取模块包括：

第三获取子模块，配置为获取用户预先设置的指令；

第四获取子模块，配置为获取所述用户通过调用指令接口从所述预先设置的指令中选择的指令。

本发明的具体实施例中，语音获取模块301的功能在终端上实际为一人机接口模块实现，确定模块302、预设信息获取模块303以及执行模块304的相应功能在终端上为一中央处理器实现；终端还包括一UI界面和一设置模块；具体的连接关系如图4所示，设置模块，提供用户自定义实际输入的内容，提供对应的自定义声音及存储功能；人机接口模块，检测收集用户声音的接口，它通过中央处理器与设置模块连接，用于收集声音并将信息传递到中央处理器；中央处理器，负责人机接口模块、UI模块，设置模块等功能模块，处理用户声音，并调用自定义语音输入模块自定义的对应输入，并将对应的输入显示在UI界面；UI界面：根据中央处理器的处理和调用情况，将用户自定义实际输入的内容显示在UI界面。

具体说明如下：

具体实施例一：

如图5所示，首先在消息编辑界面，用户发出声音“yes”，终端判断其是否自定义存储有这个声音；如果没有存储该声音，终端无响应；如有存储有该声音，终端读取该声音对应的预设信息，比如：在文本框输入“我在家呢”，然后在消息编辑框内自动输入“我在家呢”。

具体实施例二：

如图6所示，首先用户发出声音，比如“啊啊啊”，终端判断其是否自定义存储有这个声音；如果没有存储该声音，终端无响应；如有存储有该声音，终端读取该声音对应的预设信息，比如自动呼叫110，然后终端则自动呼叫110。

具体实施例三：

如图7所示，首先在信息编辑界面，用户发出声音，比如“有事打电话”，终端判断其是否自定义存储有这个声音；如果没有存储该声音，终端无响应；如有存储有该声音，终端读取该声音对应的预设信息，比如：自动发送语音内容“试验成功”，然后终端则自动向信息接收方发送语音信息“试验成功”。

具体实施例四：

如图8所示，首先用户在通话过程中发出声音，比如“我现在很好”，终端判断其是否自定义存储有这个声音；如果没有存储该声音，终端无响应；如有存储有该声音，终端读取该声音对应的预设信息，比如：自动发送语音内容“我被警察抓了”，则终端自动将“我被警察抓了”的语音信息发送出去。

具体实施例五：

如图9所示，首先用户在浏览网页过程中，发出声音，比如“翻页”，终端判断其是否自定义存储有这个声音；如果没有存储该声音，终端无响应；如有存储有该声音，终端读取该声音对应的预设信息，比如：网页自动往下翻一页，则终端上的网页自动翻到下一页。

为了更好的实现本发明实施例的方法，本发明实施例还提供一种终端，该终端包括处理器，所述处理器，配置为获取用户的输入语音；若所述终端侧开启预设功能，确定所述终端侧是否预先存储有与所述输入语音一致的标识语音；若存在所述标识语音，根据所述标识语音，获取预先设置的与所述标识语音的含义不相关的预设信息；执行所述预设信息对应的操作。

本发明实施例所述语音控制的方法如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。这样，本发明实施例不限制于任何特定的硬件和软件结合。

相应的，本发明实施例还提供一种计算机存储介质，其中存储有计算机程序，该计算机程序用于执行本发明实施例的语音控制的方法。

需要说明的是，本发明实施例提供的语音控制的装置是利用上述语音控制的方法的装置，则上述方法的所有实施例均适用于该装置，且均能达到相同或相似的有益效果。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

工业实用性

本发明实施例中通过预先设置的与标识语音的含义不相关的预设信息使得其他用户无法直接获取用户的真实意图，实现了个性化的语音控制设置，大大提高了终端语音输入的安全性和服务性；同时提高了用户满意度。

Claims

一种语音控制的方法，应用于终端侧，所述方法包括：

获取用户的输入语音；

若所述终端侧开启预设功能，确定所述终端侧是否预先存储有与所述输入语音一致的标识语音；

若存在所述标识语音，根据所述标识语音，获取预先设置的与所述标识语音的含义不相关的预设信息；

执行所述预设信息对应的操作。
根据权利要求1所述的语音控制的方法，其中，若所述终端侧未开启所述预设功能，所述方法还包括：

解析所述输入语音，确定所述输入语音的含义；

根据所述输入语音的含义，执行对应操作。
根据权利要求1所述的语音控制的方法，其中，所述预先设置的与所述标识语音的含义不相关的预设信息的设置步骤包括：

获取所述用户通过预设接口输入的预设信息，所述预设信息用于指示所述终端执行相应操作；

响应所述用户通过语音接口输入语音的操作，将输入的所述语音设置为所述预设信息设置的标识语音；其中，所述预设信息和所述标识语音的内容不相关。
根据权利要求3所述的语音控制的方法，其中，所述获取所述用户通过预设接口输入的预设信息，包括：

获取所述用户通过输入文本接口输入的文本。
根据权利要求3所述的语音控制的方法，其中，所述获取所述用户通过预设接口输入的预设信息，包括：

获取所述用户通过输入语音接口输入的语音。
根据权利要求3所述的语音控制的方法，其中，所述获取所述用户通过预设接口输入的预设信息，包括：

获取用户预先设置的指令；

获取所述用户通过调用指令接口从所述预先设置的指令中选择的指令。
一种语音控制的装置，应用于终端侧，该装置包括：语音获取模块、确定模块、预设信息获取模块、第一执行模块；其中，

语音获取模块，配置为获取用户的输入语音；

确定模块，配置为若所述终端侧开启预设功能，确定所述终端侧是否预先存储有与所述输入语音一致的标识语音；

预设信息获取模块，配置为若存在所述标识语音，根据所述标识语音，获取预先设置的与所述标识语音的含义不相关的预设信息；

第一执行模块，配置为执行所述预设信息对应的操作。
根据权利要求7所述的语音控制的装置，其中，若所述终端侧未开启所述预设功能，所述装置还包括：

解析模块，配置为解析所述输入语音，确定所述输入语音的含义；

第二执行模块，配置为根据所述输入语音的含义，执行对应操作。
根据权利要求7所述的语音控制的装置，其中，所述装置还包括：

获取模块，配置为获取所述用户通过预设接口输入的预设信息，所述预设信息配置为指示所述终端执行相应操作；

设置模块，配置为响应所述用户通过语音接口输入语音的操作，将输入的所述语音设置为所述预设信息设置的标识语音；其中，所述预设信息和所述标识语音的内容不相关。
根据权利要求9所述的语音控制的装置，其中，所述获取模块包括：

第一获取子模块，配置为获取所述用户通过输入文本接口输入的文本。
根据权利要求9所述的语音控制的装置，其中，所述获取模块包括：

第二获取子模块，配置为获取所述用户通过输入语音接口输入的语音。
根据权利要求9所述的语音控制的装置，其中，所述获取模块包括：

第三获取子模块，配置为获取用户预先设置的指令；

第四获取子模块，配置为获取所述用户通过调用指令接口从所述预先设置的指令中选择的指令。
一种终端，该终端包括处理器，所述处理器，配置为获取用户的输入语音；若所述终端侧开启预设功能，确定所述终端侧是否预先存储有与所述输入语音一致的标识语音；若存在所述标识语音，根据所述标识语音，获取预先设置的与所述标识语音的含义不相关的预设信息；执行所述预设信息对应的操作。
一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1-6任一项的方法。