CN112565659B

CN112565659B - 一种在音视频应用工作时执行语音指令的方法

Info

Publication number: CN112565659B
Application number: CN202011417666.9A
Authority: CN
Inventors: 南习清; 袁伟晋
Original assignee: Konka Group Co Ltd
Current assignee: Konka Group Co Ltd
Priority date: 2020-12-07
Filing date: 2020-12-07
Publication date: 2023-08-18
Anticipated expiration: 2040-12-07
Also published as: CN112565659A

Abstract

本发明公开了一种在音视频应用工作时执行语音指令的方法，所述方法包括：在音视频应用工作时监听语音按键的电平触发信息，得到语音按键的触发结果；根据所述触发结果，确定是否调用录音设备；当确定调用所述录音设备时，则执行与所述录音设备接收的语音指令对应的语音操作。本发明实施通过***监控语音案件的电平触发信息，来协调音视频应用和智能语音应用释放和获取录音设备，从而实现在音视频应用工作时执行语音指令，实现方法简单，节省资源，便于维护。

Description

一种在音视频应用工作时执行语音指令的方法

技术领域

本发明涉及人工智能技术领域，尤其涉及的是一种在音视频应用工作时执行语音指令的方法。

背景技术

目前市场上智能大屏在音视频通话中基本都不能做到接收AI语音指令，少部分厂家在特定的音视频语音通话中，依赖tinyalsa，采用JNI方式可以同时接收语音指令。但这种方案涉及底层修改，修改难度大，容易影响到整个***的录音设备的管理和***稳定，应用本身的维护也比较难。

因此，现有技术还有待改进和发展。

发明内容

本发明要解决的技术问题在于，针对现有技术的上述缺陷，提供一种在音视频应用工作时执行语音指令的方法，旨在解决现有技术的Android***，录音设备是独占，音频和视频通话时，无法同时开启智能语音应用也即AI语音APP和音视频应用也即音视频通话APP所需的录音设备。造成在音视频通话中，AI语音APP因无法获取录音设备而无法使用AI语音指令进行相关操作，而即使实现了音视频通话的同时又实现执行智能语音指令的方法非常复杂，修改难度大，影响到整个***的录音设备的管理和***稳定，应用本身的维护也比较难的问题。

本发明解决问题所采用的技术方案如下：

第一方面，本发明实施例提供一种在音视频应用工作时执行语音指令的，其中，所述方法包括：

在音视频应用工作时监听语音按键的电平触发信息，得到语音按键的触发结果；

根据所述触发结果，确定是否调用录音设备；

当确定调用所述录音设备时，则执行与所述录音设备接收的语音指令对应的语音操作。

在一种实现方式中，其中，所述在音视频应用工作时监听语音按键的电平触发信息，得到语音按键的触发结果包括：

在音视频应用工作时监听到语音按键的电平触发信息为下降沿，则得到语音按键的触发结果为开启；

在音视频应用工作时监听到语音按键的电平触发信息为上升沿，则得到语音按键的触发结果为关闭。

在一种实现方式中，其中，所述根据所述触发结果，确定是否调用录音设备包括：

当得到语音按键的触发结果为开启时，则确定调用录音设备；

当得到语音按键的触发结果为关闭时，则确定释放录音设备。

当得到语音按键的触发结果为开启时，向音视频应用发送停止录音广播数据，并控制所述音视频应用释放所述录音设备；

当得到语音按键的触发结果为关闭时，向音视频应用发送启动录音广播数据，并控制所述音视频应用调用所述录音设备。

在一种实现方式中，其中，所述控制音视频应用释放所述录音设备包括：

获取智能语音应用发送的停止录音广播数据；

根据所述停止录音广播数据，调用自定义类对象停止录音控制方法；

根据所述自定义类对象停止录音控制方法，释放所述录音设备。

在一种实现方式中，其中，所述控制音视频应用释放所述录音设备还包括：

当所述音视频应用释放所述录音设备后，所述音视频应用继续保持通话连接。

在一种实现方式中，其中，所述音视频应用调用所述录音设备的操作包括：

获取智能语音应用发送的启动录音广播数据；

根据所述启动录音广播数据，调用自定义类对象开始录音控制方法；

根据所述自定义类对象开始录音控制方法，调用所述录音设备。

在一种实现方式中，其中，所述当确定调用所述录音设备时，则执行与所述录音设备接收的语音指令对应的语音操作包括：

当确定调用所述录音设备时，则获取录音设备接收的语音指令；

将所述语音指令转换成文本信息；

执行与所述文本信息对应的语音操作。

第二方面，本发明实施例还提供在音视频应用工作时执行语音指令的装置，其中，所述装置包括：

语音按键的触发结果获取单元，用于在音视频应用工作时监听语音按键的电平触发信息，得到语音按键的触发结果；

录音设备调用判断单元，用于根据所述触发结果，确定是否调用录音设备；

语音指令执行单元，用于当确定调用所述录音设备时，则执行与所述录音设备接收的语音指令对应的语音操作。

第三方面，本发明实施例还提供一种智能终端，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如上述任意一项所述的在音视频应用工作时执行语音指令的方法。

第四方面，本发明实施例还提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如上述中任意一项所述的在音视频应用工作时执行语音指令的方法。

本发明的有益效果：本发明实施例首先在音视频应用工作时监听语音按键的电平触发信息，得到语音按键的触发结果；然后根据所述触发结果，确定智能语音应用是否调用录音设备；最后当确定智能语音应用调用所述录音设备时，则执行与所述录音设备接收的语音指令对应的语音操作；可见，本发明实施通过***监控语音案件的电平触发信息，来协调音视频应用和智能语音应用释放和获取录音设备，从而实现在音视频应用工作时执行语音指令，实现方法简单，节省资源，便于维护。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1本发明实施例提供一种在音视频应用工作时执行语音指令的方法流程示意图

图2本发明实施例提供的一种在音视频应用工作时执行语音指令的装置的原理框图。

图3本发明实施例提供的智能终端的内部结构原理框图。

具体实施方式

本发明公开了一种在音视频应用工作时执行语音指令的方法、智能终端、存储介质，为使本发明的目的、技术方案及效果更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

由于现有技术的Android***，录音设备是独占，音频和视频通话时，无法同时开启智能语音应用也即AI语音APP和音视频应用也即音视频通话APP所需的录音设备。造成在音视频通话中，AI语音APP因无法获取录音设备而无法使用AI语音指令进行相关操作，现有技术中即使实现了音视频通话的同时实现执行智能语音指令的方法非常复杂，修改难度大，影响到整个***的录音设备的管理和***稳定，应用本身的维护也比较难。

为了解决现有技术的问题，本实施例提供了一种在音视频应用工作时执行语音指令的方法，本方法通过在音视频应用工作时，后台***监听语音按键的电平触发信号，实际中，电平触发信号有高电平、低电平，上升沿和下降沿，在此不做限制，然后后台***就能得到语音按键的触发结果，所述触发结果可以为打开也可以为关闭，然后根据所述触发结果，后台***就能确定智能语音应用能否调用录音设备，实际中，可以根据触发结果为打开来确定智能语音应用调用录音设备，同时根据触发结果为关闭来确定智能语音应用不调用录音设备；同样的，也可以根据触发结果为关闭来确定智能语音应用调用录音设备，同时根据触发结果为打开来确定智能语音应用不调用录音设备，在此不做限制。最后，当确定智能语音应用调用录音设备时，录音设备便可以接收语音指令，后台***便执行录音设备接收的语音指令对应的语音操作。本发明实施例通过***监控语音案件的电平触发信息，来协调音视频应用和智能语音应用释放和获取录音设备，从而实现在音视频应用工作时执行语音指令，实现方法简单，节省资源，便于维护。

举例说明

随着Android智能电视的AI化，要求全程支持AI语音指令。要求在音视频通话过程中能进行AI语音指令操作。但对Android***，录音设备是独占，音频和视频通话时，无法同时开启智能语音应用和音视频应用所需的录音设备，在本实施例中，智能语音应用为AI语音APP，音视频应用为音视频通话APP。造成在音视频通话中，AI语音APP因无法获取录音设备而无法使用AI语音指令进行相关操作。即使目前Android智能电视有部分厂家可以实现在音视频通话中进行AI语音指令，实现的方式是在***音频底层，依赖tinyalsa，采用JNI方式实现。实现方式较为复杂并难以维护。本发明实施例通过封装标准的android SDK的AudioRecorder类，通过在音视频应用工作时监听语音按键的电平触发信号，也即通过AI语音APP后台监控电视遥控器的语音按键的keydown和keyup事件，得到语音按键的触发结果，然后根据触发结果来协调录音设备的获取、释放，达到在音视频通话时可以进行AI语音指令的操作。

示例性方法

本实施例提供一种在音视频应用工作时执行语音指令的方法，该方法可以应用于人工智能的智能终端。具体如图1所示，所述方法包括：

步骤S100、在音视频应用工作时监听语音按键的电平触发信号，得到语音按键的触发结果；

具体地，由于现有的技术中，在音视频应用工作时，无法同时执行智能语音应用的语音指令操作，因此，本发明实施例在音视频应用工作时，通过监听语音按键的电平触发信号，得到语音按键的触发结果，为后续智能语音应用是否调用录音设备做准备。本发明实施例在现有的Android SDK上，在音视频通话APP中封装标准的AudioRecorder类，通过后台监控电视遥控器的语音按键的操作，从而为后续协调音视频通话应用的录音设备与智能语音应用所用的录音设备的获取、释放做准备。

为了得到语音按键的触发结果，所述在音视频应用工作时监听语音按键的电平触发信号，得到语音按键的触发结果包括如下步骤：

步骤S101、在音视频应用工作时监听到语音按键的电平触发信号为下降沿，则得到语音按键的触发结果为开启；

步骤S102、在音视频应用工作时监听到语音按键的电平触发信号为上升沿，则得到语音按键的触发结果为关闭。

实际中，后台***在音视频应用工作时监听语音按键的电平触发信号，当在音视频应用工作时监听到语音按键的电平触发信号为下降沿时，也即，在音视频应用工作时，监控到健康遥控器的语音按键的按下事件，则得到健康遥控器的语音按键的触发结果为开启；当监听到语音按键的电平触发信号为上升沿时，也即监控健康遥控器的语音按键的弹起事件，则得到健康遥控器的语音按键的触发结果为关闭。在本实施例中，电平触发信号采用下降沿或者上升沿，可以防止抖动带来的判断失误。

步骤S200、根据所述触发结果，确定是否调用录音设备；

具体地，当后台***获得语音按键的触发结果为开启或者关闭时，就可以确定智能语音应用是否调用录音设备，如当后台***获得语音按键的触发结果为开启时，确定智能语音应用可以调用录音设备，或者当后台***获得语音按键的触发结果为关闭时，确定智能语音应用可以调用录音设备，在此不做限制。

为了确定智能语音应用是否调用录音设备，所述根据所述触发结果，确定是否调用录音设备包括如下步骤：

步骤S201、当得到语音按键的触发结果为开启时，则确定调用录音设备；

步骤S202、当得到语音按键的触发结果为关闭时，则确定释放录音设备。

具体地，用户在音视频通话时，需要使用AI语音指令进行操作，按下健康遥控器语音键，后台***得到语音按键的触发结果为开启时，则确定智能语音应用可以调用录音设备，录音设备从提供给音视频应用使用变成提供给智能语音应用使用，完成应用之间的切换。当用户不需要使用AI语音指令进行操作，弹起遥控器语音键，后台***得到语音按键的触发结果为关闭时，则确定智能语音应用释放录音设备，这时，录音设备从提供给智能语音应用使用变成提供给音视频应用使用。

在另一种实现方式中，用户在音视频通话时，需要使用AI语音指令进行操作，按下遥控器语音键，电视端智能语音应用也即AI语音APP后台会接收到该按键的按下事件，后台***得到语音按键的触发结果为开启时，向音视频应用发送停止录音广播数据，同时后台***控制音视频应用释放录音设备；音视频应用也即音视频通话APP中的AudioMsgRecevier对象接收到启动录音的事件通知，调用自定义对象IMSRecorder的stopRecording方法停止录音设备。当用户不需要使用AI语音指令进行操作，弹起遥控器语音键，向音视频应用发送启动录音广播数据，同时控制所述音视频应用调用所述录音设备，音视频应用也即音视频通话APP中的AudioMsgRecevier对象接收到启动录音的事件通知，调用自定义对象IMSRecorder的startRecording方法获取录音设备，继续采集语音数据和通话。

所述控制音视频应用释放所述录音设备包括如下操作：获取智能语音应用发送的停止录音广播数据；根据所述停止录音广播数据，调用自定义类对象停止录音控制方法；根据所述自定义类对象停止录音控制方法，音视频应用释放所述录音设备。

实际中，由于智能语音应用发送了停止录音广播数据，音视频应用也即音视频通话APP中创建AudioMsgRecevier对象在该对象的OnReceive方法中接收和处理遥控器语音按键按下事件消息。音视频应用就可以获取到所述停止录音广播数据，并根据停止录音广播数据调用后台***中自定义类对象停止录音控制方法。在本实施例中，音视频应用也即音视频通话APP封装Android标准的AudioRecorder类，实现自定义的IMSRecorder类。该类主要实现方法包括初始化录音设备方法initRecord，录音方法recordAudio、获取录音设备并开始录音方法startRecording和停止并释放录音设备的stopRecording方法；自定义类对象停止录音控制方法即为录音设备的stopRecording方法。最后音视频应用根据所述自定义类对象停止录音控制方法，释放所述录音设备，音视频应用停止采集语音数据和通话，以备所述智能语音应用使用所述录音设备。

所述控制音视频应用释放所述录音设备还包括如下操作：当所述音视频应用释放所述录音设备后，所述音视频应用继续保持通话连接。

在本实施例中，当所述音视频应用释放所述录音设备后，音视频应用停止采集语音数据和通话，如果这时断掉音视频应用，就会突然中断用户的通话连接，导致用户连图像都无法接收到，从而影响用户音视频通话体验；实际中，用户执行语音指令的时间其实是非常短的，当音视频应用释放所述录音设备后，音视频应用继续保持通话连接，此时音视频应用只是暂时性的接收不到用户的声音，当用户执行完智能语音应用的语音指令后马上回到音视频应用，这个过程就像网络突然卡顿时没有声音，用户能耐心等待网络恢复正常后继续通话，因此，音视频应用暂时性释放录音设备不会对用户体验造成太大的影响。

所述音视频应用调用所述录音设备的操作包括如下操作：获取智能语音应用发送的启动录音广播数据；根据所述启动录音广播数据，调用自定义类对象开始录音控制方法；根据所述自定义类对象开始录音控制方法，调用所述录音设备。

实际中，由于智能语音应用发送了启动录音广播数据，音视频应用也即音视频通话APP中创建AudioMsgRecevier对象在该对象的OnReceive方法中接收和处理遥控器语音按键弹起事件消息。音视频应用就可以获取到所述启动录音广播数据，并根据启动录音广播数据调用后台***中自定义类对象启动录音控制方法。在本实施例中，音视频应用也即音视频通话APP封装Android标准的AudioRecorder类，实现自定义的IMSRecorder类。该类主要实现方法包括初始化录音设备方法initRecord，录音方法recordAudio、获取录音设备并开始录音方法startRecording和停止并释放录音设备的stopRecording方法；自定义类对象启动录音控制方法即为录音设备的startRecording方法。最后音视频应用根据所述自定义类对象启动录音控制方法，调用所述录音设备，音视频应用调用自定义的IMSRecorder获取录音设备，并开始采集语音数据和通话。

步骤S300、当确定调用所述录音设备时，则执行与所述录音设备接收的语音指令对应的语音操作。

具体地，当确定智能语音应用调用录音设备时，则用户就可以对着录音设备发送语音指令，后台***就可以执行所述语音指令，如用户在音视频通话过程中听说了一个很好看的电影《八佰》，用户就按下健康语音按键，向录音设备发送语音指令：“我要打开电影八佰”，然后智能终端中的后台***就可以执行这个语音指令，将电影《八佰》打开，当智能终端中的后台***执行完这个语音指令后，用户松开语音按键，继续进行音视频应用通话。

为了使后台***能执行与所述录音设备接收的语音指令对应的语音操作，所述当确定智能语音应用调用所述录音设备时，则执行与所述录音设备接收的语音指令对应的语音操作包括如下步骤：

步骤S301、当确定调用所述录音设备时，则获取录音设备接收的语音指令；

步骤S302、将所述语音指令转换成文本信息；

步骤S303、执行与所述文本信息对应的语音操作。

具体地，具体地，人与人之间是可以通过相互沟通来实现交流的，但是机器是没法直接像人一样直接进行口语交流的，因此，需要将人的语言转化成机器能识别的语言。在本实施例中，当用户对着录音设备发出语音时，录音设备先获取用户的语音指令，然后识别输入的语音指令，然后将语音指令通过语音识别转换为文本信息，后台***就可以根据该文本信息执行与文本信息对应的语音操作。

示例性设备

如图2中所示，本发明实施例提供一种在音视频应用工作时执行语音指令的装置，该装置包括语音按键的触发结果获取单元401，录音设备调用判断单元402，语音指令执行单元403，其中：

语音按键的触发结果获取单元401，用于在音视频应用工作时监听语音按键的电平触发信息，得到语音按键的触发结果；

录音设备调用判断单元402，用于根据所述触发结果，确定是否调用录音设备；

语音指令执行单元403，用于当确定调用所述录音设备时，则执行与所述录音设备接收的语音指令对应的语音操作。

基于上述实施例，本发明还提供了一种智能终端，其原理框图可以如图3所示。该智能终端包括通过***总线连接的处理器、存储器、网络接口、显示屏、温度传感器。其中，该智能终端的处理器用于提供计算和控制能力。该智能终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该智能终端的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种在音视频应用工作时执行语音指令的方法。该智能终端的显示屏可以是液晶显示屏或者电子墨水显示屏，该智能终端的温度传感器是预先在智能终端内部设置，用于检测内部设备的运行温度。

本领域技术人员可以理解，图3中的原理图，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的智能终端的限定，具体的智能终端可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种智能终端，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

在音视频应用工作时监听语音按键的电平触发信号，得到语音按键的触发结果；

根据所述触发结果，确定是否调用录音设备；

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

综上所述，本发明公开了在音视频应用工作时执行语音指令的方法、智能终端、存储介质，所述方法包括：本发明实施例首先在音视频应用工作时监听语音按键的电平触发信息，得到语音按键的触发结果；然后根据所述触发结果，确定智能语音应用是否调用录音设备；最后当确定智能语音应用调用所述录音设备时，则执行与所述录音设备接收的语音指令对应的语音操作；可见，本发明实施通过***监控语音案件的电平触发信息，来协调音视频应用和智能语音应用释放和获取录音设备，从而实现在音视频应用工作时执行语音指令，实现方法简单，节省资源，便于维护。

应当理解的是，本发明公开了一种在音视频应用工作时执行语音指令的方法，应当理解的是，本发明的应用不限于上述的举例，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims

1.一种在音视频应用工作时执行语音指令的方法，其特征在于，所述方法包括：

根据所述触发结果，确定智能语音应用是否调用录音设备；

当确定所述智能语音应用调用所述录音设备时，则执行与所述录音设备接收的语音指令对应的语音操作；

所述在音视频应用工作时监听语音按键的电平触发信号，得到语音按键的触发结果包括：

在音视频应用工作时监听到语音按键的电平触发信号为下降沿，即当监控到所述语音按键的按下事件，则得到语音按键的触发结果为开启；

在音视频应用工作时监听到语音按键的电平触发信号为上升沿，即当监控到所述语音按键的弹起事件，则得到语音按键的触发结果为关闭；

所述根据所述触发结果，确定智能语音应用是否调用录音设备包括：

当得到语音按键的触发结果为开启时，则确定所述智能语音应用调用录音设备；

当得到语音按键的触发结果为关闭时，则确定所述智能语音应用释放录音设备；

所述根据所述触发结果，确定智能语音应用是否调用录音设备还包括：

当所述音视频应用释放所述录音设备时，所述音视频应用停止采集语音数据和通话，但所述音视频应用继续保持通话连接；

2.根据权利要求1所述的在音视频应用工作时执行语音指令的方法，其特征在于，所述控制音视频应用释放所述录音设备包括：

获取智能语音应用发送的停止录音广播数据；

根据所述停止录音广播数据，所述音视频应用调用自定义类对象停止录音控制方法；

根据所述自定义类对象停止录音控制方法，所述音视频应用释放所述录音设备。

3.根据权利要求1所述的在音视频应用工作时执行语音指令的方法，其特征在于，所述控制音视频应用调用所述录音设备的操作包括：

获取智能语音应用发送的启动录音广播数据；

根据所述启动录音广播数据，所述音视频应用调用自定义类对象开始录音控制方法；

根据所述自定义类对象开始录音控制方法，所述音视频应用调用所述录音设备。

4.根据权利要求1所述的在音视频应用工作时执行语音指令的方法，其特征在于，所述当确定所述智能语音应用调用所述录音设备时，则执行与所述录音设备接收的语音指令对应的语音操作包括：

当确定所述智能语音应用调用所述录音设备时，则获取录音设备接收的语音指令；

将所述语音指令转换成文本信息；

执行与所述文本信息对应的语音操作。

5.一种智能终端，其特征在于，包括有存储器，一个或者一个以上的处理器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如权利要求1-4中任意一项所述的方法。

6.一种非临时性计算机可读存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1-4中任意一项所述的方法。