CN107861706A - 一种语音指令的响应方法及装置 - Google Patents

一种语音指令的响应方法及装置 Download PDF

Info

Publication number
CN107861706A
CN107861706A CN201711083769.4A CN201711083769A CN107861706A CN 107861706 A CN107861706 A CN 107861706A CN 201711083769 A CN201711083769 A CN 201711083769A CN 107861706 A CN107861706 A CN 107861706A
Authority
CN
China
Prior art keywords
phonetic order
manipulations
many
application
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711083769.4A
Other languages
English (en)
Inventor
李毅
李雨萌
向宁
靳晓冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Chengdu - Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu - Digital Technology Co Ltd filed Critical Chengdu - Digital Technology Co Ltd
Priority to CN201711083769.4A priority Critical patent/CN107861706A/zh
Publication of CN107861706A publication Critical patent/CN107861706A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)

Abstract

本申请提供了一种语音指令的响应方法及装置,以接收到的多操作指令为依据,在接收到语音指令后,执行语音指令对应的预设的多步操作,因为多步操作包括基于至少一个应用的多步操作,并且,多步操作与所述语音指令的对应关系由用户预先设置,可见,用户可以基于一个语音指令触发应用的多步操作,所以,语音操作具有较高的便利性。

Description

一种语音指令的响应方法及装置
技术领域
本申请涉及电子信息领域,尤其涉及一种语音指令的响应方法及装置。
背景技术
随着电子设备的智能化的发展,电子设备上的语音功能越来越强大。现有技术中,常见的语音功能为:电子设备依据用户发出的语音指令,执行相应的操作。例如,用户对手机说出语音指令:“导航”,手机在接收到该语音指令后,自动打开导航软件。
目前,相比于手动操作,语音操作还是不够便利,因此,导致语音功能的使用并不普遍。可见,如何提高语音操作的便利性,成为目前亟待解决的问题。
发明内容
本申请提供了一种语音指令的响应方法及装置,目的在于解决如何提高语音操作的便利性的问题。
为了实现上述目的,本申请提供了以下技术方案:
一种语音指令的响应方法,其特征在于,包括:
接收多操作指令;
获取语音指令;
执行所述语音指令对应的多步操作,所述多步操作包括基于至少一个应用的多步操作,所述多步操作与所述语音指令的对应关系由用户预先设置。
可选的,所述多步操作与所述语音指令的对应关系的设置过程包括:
接收设置指令;
记录用户输入的所述语音指令;
记录所述用户在选择的所述至少一个应用上执行的所述多步操作;
建立所述多步操作与所述语音指令之间的对应关系。
可选的,所述获取语音指令包括:
接收语音信号;
依据所述至少一个应用的名称,识别所述语音信号指示的所述语音指令。
可选的,还包括:
在识别出所述语音信号指示的语音指令为第一应用的名称的情况下,执行基于所述第一应用的操作。
可选的,所述执行所述语音指令对应的多步操作包括:
在任意一个界面上,执行所述语音指令对应的多步操作。
可选的,所述任意一个界面包括:
锁屏界面;或者,
文本显示界面。
一种语音指令的响应装置,包括:
接收模块,用于接收多操作指令;
获取模块,用于获取语音指令;
执行模块,用于执行所述语音指令对应的多步操作,所述多步操作包括基于至少一个应用的多步操作,所述多步操作与所述语音指令的对应关系由用户预先设置。
可选的,还包括:
设置模块,用于接收设置指令;记录用户输入的所述语音指令;记录所述用户在选择的所述至少一个应用上执行的所述多步操作;建立所述多步操作与所述语音指令之间的对应关系。
可选的,所述获取模块用于获取语音指令包括:
所述获取模块具体用于,接收语音信号;依据所述至少一个应用的名称,识别所述语音信号指示的所述语音指令。
可选的,所述执行模块还用于:
在识别出所述语音信号指示的语音指令为第一应用的名称的情况下,执行基于所述第一应用的操作。
可选的,所述执行模块用于执行所述语音指令对应的多步操作包括:
所述执行模块具体用于,在任意一个界面上,执行所述语音指令对应的多步操作。
本申请所述的语音指令的响应方法及装置,以接收到的多操作指令为依据,在接收到语音指令后,执行语音指令对应的预设的多步操作,因为多步操作包括基于至少一个应用的多步操作,并且,多步操作与所述语音指令的对应关系由用户预先设置,可见,用户可以基于一个语音指令触发应用的多步操作,所以,语音操作具有较高的便利性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种语音指令的响应方法的流程图;
图2(a)、图2(b)和图2(c)为本申请实施例公开的基于地图APP的多步操作的示意图;
图3为本申请实施例公开的一种语音指令的响应装置的结构示意图。
具体实施方式
本申请实施例公开的语音指令的响应方法及装置,可以应用在电子设备上。所述电子设备上可以预先安装应用(APP)。本申请实施例公开的方法以及装置的目的在于,使得电子设备可以基于用户的语音指令执行一组操作,以提高语音操作的便利性。
本申请所述的电子设备,包括移动终端,例如智能手机、平板电脑等。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例公开的一种语音指令的响应方法,包括以下步骤:
S101:设置语音指令与多步操作的对应关系。
其中,多步操作是指,基于至少一个APP的多步操作。如前所述,电子设备上预先设置有APP,任意一个APP为了实现自身的功能,具有一定的操作逻辑。用户在使用APP的过程中,按照APP的操作逻辑进行操作,即可实现APP的功能。
例如,图2为常见的地图APP的界面,这款APP具有导航功能,为了实现这个功能,用户需要在图2(a)所示的界面上,点击“路线”,进入图2(b)所示的界面,再在图2(b)所示的界面上,再分别输入“起点位置”和“终点位置”,即可得到从起点位置到终点位置的导航路线,如图2(c)所示。
图2所示的操作即为基于地图APP的多步操作。
本实施例中,设置语音指令与多步操作的对应关系的具体实现方式为:
1、接收设置指令,设置指令可以为语音指令,也可以为用户在电子设备上的操作触发的指令,例如,用户进入电子设备的“设置”界面,通过选择“设置”界面中的选项“语音多操作设置”进入对应关系的输入界面。
2、记录用户输入的语音指令,例如,接收用户输入的语音“导航”。
3、记录用户在选择的至少一个应用上执行的多步操作
接上例,假设用户选择的应用为地图APP,用户点击启动地图APP,电子设备显示图2(a)所示的界面,用户接着点击“路线”,进入图2(b)所示的界面,并选择“起点位置”为“我的位置”,然后点击“终点位置”输入框,至此,用户停止操作。
可见,用户的操作停止在“终点位置”输入步骤。因此,用户从点击地图APP直到输入“终点位置”之前的操作被记录。
4、建立用户输入的语音指令与用户的多步操作之间的对应关系。
具体的,建立对应关系的过程可以参见现有技术,例如,对应存储等,这里不再赘述。
接上例,建立起语音“导航”与用户在地图APP上的上述一系列操作之间的对应关系。
因为上述对应关系的建立过程中,用户只需在APP上进行操作,操作即可被记录,所以,对应关系的设置过程的交互性较高,对于用户而言,简单直观,有利于提升用户的使用体验和兴趣。
S101为建立对应关系的过程,可以预先被执行,即S101为预设步骤,为以下语音指令的响应过程奠定基础。用户可设置多组对应关系,多组对应关系构成指令库。
S102:接收多操作指令。
本实施例中,多操作指令为一种触发指令,用于触发以多步操作响应语音指令的功能。
具体的,多操作指令可以为预设的按键触发的指令,也就是说,用户按下电子设备上的某个或某些按键,电子设备生成多操作指令。其中,预设的按键可以为实体按键,也可以为虚拟按键,可以为单个按键,也可以为组合按键。
S103:获取语音指令。
具体的,可以监听语音信号,在接收到语音信号后,依据S101中得到的指令库中的语音指令,识别语音信号指示的语音指令。具体的语音识别方式可以参见现有技术,这里不再赘述。
S104:执行语音指令对应的多步操作。
语音指令对应的多步操作可以通过查询S101中得到的对应关系得到。
可选的,在依据指令库识别语音指令失败的情况下,还可以依据电子设备上的APP的名称,识别语音信号,在识别结果为某个APP的名称的情况下,执行在指令库中存储该APP的多步操作。例如,指令库中包括语音指令“导航”,而接收到的语音信号为“地图”,与“导航”不匹配,在此情况下,因此,依据电子设备上的APP的名称进行识别,在电子设备上已安装“XX地图”的情况下,可以识别出语音信号指示的语音指令为“地图”,再从指令库中查询“XX地图”的多步操作,并执行查询到的多步操作。
将APP的名称作为语音识别的依据,有利于提高本实施例所述方法的宽容性,即在用户没有准确说出预设的语音指令,而仅说出APP名称的情况下,也能触发操作。
从图1所示的过程可以看出,本实施例中,在接收到多操作指令后,依据用户的语音指令,可以执行多步操作。与现有技术中一个语音指令执行一个操作相比,用户可以通过一个语义指令,对应用进行多步操作,例如,现有技术中,语音指令“导航”只能启动地图类APP,而用户还需要在APP的界面上继续进行操作,才能得到导航路线。而本实施例所述的方法,用户说出语音指令“导航”后,电子设备启动地图类APP,并在地图类APP的界面上自动进行操作,直至操作到输入终点位置的界面,用户可以语音或者手动输入终点位置,从而提高语音功能的便利性。
另一方面,图1所示的方法,允许用户自定义设置语音指令与多步操作的对应关系,因此,用户可以针对已安装的APP自由设置语音与操作之间的对应关系,方便用户快捷高效地使用语音功能。
相比与现有的根据语音识别出用户意图的方法相比,本实施例中,用户可以设置简单的语音指令,一个简单的语音指令即可触发多步操作。因为语音指令简单有效,所以,能够降低语音识别分析的难度,从而降低语音识别的错误率。
图1所示的方法可以应用在电子设备的任何界面上。下面以锁屏界面和文字显示界面为例进行举例说明。
在锁屏界面(有可能是屏幕熄灭状态),用户输入语音“导航”,手机自动启动地图APP,并自动对地图APP操作至终点位置输入之前,用户(语音)输入终点位置,地图APP输出导航路线。
在文字显示界面,显示的内容包括中文和英文。用户输入语音“翻译”,手机自动启动翻译APP,并自动从文字显示界面中提取出全部英文单词,再将英文单词输入翻译APP,可选的,在英文单词成句出现的情况下,可以询问用户是否进行全文翻译,最后将翻译APP输出的中文翻译进行显示。
需要说明的是,在文字显示界面的场景下,执行的多步操作为针对两个应用的操作。具体的,针对显示文字的应用执行的操作至少为:从文字显示界面中提取出全部英文单词,针对翻译APP执行的操作至少为:将英文单词输入翻译APP。进一步的,还可以调用文字编辑类应用,删除中英文混合排版的内容中的中文,只提取英文文本进行翻译。
图3为本申请实施例公开的一种语音指令的响应装置,包括:接收模块、获取模块和执行模块。可选的,还可以包括设置模块。
其中,接收模块用于接收多操作指令。获取模块用于获取语音指令。执行模块用于执行所述语音指令对应的多步操作,所述多步操作包括基于至少一个应用的多步操作,所述多步操作与所述语音指令的对应关系由用户预先设置。可选的,执行模块还可以用于在识别出所述语音信号指示的语音指令为第一应用的名称的情况下,执行基于所述第一应用的操作。
设置模块用于接收设置指令,记录用户输入的所述语音指令以及所述用户在选择的所述至少一个应用上执行的所述多步操作,并建立所述多步操作与所述语音指令之间的对应关系。
以上各个模块的功能的具体实现方式,可以参见上述方法实施例,这里不再赘述。
本实施例所述的装置,可以设置在电子设备上,除了上述锁屏界面和翻译界面之外,还可以与电子设备上的其它应用配合使用,实现多种场景下的语音触发多步操作的目的。例如,语音指令“微信扫描”或者“支付宝扫描”触发启动应用(微信或支付宝),并进入应用的扫一扫界面。又例如,语音指令“微信支付”或者“支付宝支付”触发启动应用(微信或支付宝),并在应用内完成支付。又例如,语音指令“回家”触发启动导航应用,并通过导航应用提供从当前位置到预设的“家”的位置的导航路线。又例如,语音指令“打开网址”触发启动浏览器,并跳转到预设的网站的界面上。
可见,本实施例所述的装置,能够支持多场景下的语音触发多步操作,因此,有利于提高语音操作的便利性。
本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (11)

1.一种语音指令的响应方法,其特征在于,包括:
接收多操作指令;
获取语音指令;
执行所述语音指令对应的多步操作,所述多步操作包括基于至少一个应用的多步操作,所述多步操作与所述语音指令的对应关系由用户预先设置。
2.根据权利要求1所述的方法,其特征在于,所述多步操作与所述语音指令的对应关系的设置过程包括:
接收设置指令;
记录用户输入的所述语音指令;
记录所述用户在选择的所述至少一个应用上执行的所述多步操作;
建立所述多步操作与所述语音指令之间的对应关系。
3.根据权利要求1所述的方法,其特征在于,所述获取语音指令包括:
接收语音信号;
依据所述至少一个应用的名称,识别所述语音信号指示的所述语音指令。
4.根据权利要求3所述的方法,其特征在于,还包括:
在识别出所述语音信号指示的语音指令为第一应用的名称的情况下,执行基于所述第一应用的操作。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述执行所述语音指令对应的多步操作包括:
在任意一个界面上,执行所述语音指令对应的多步操作。
6.根据权利要求5所述的方法,其特征在于,所述任意一个界面包括:
锁屏界面;或者,
文本显示界面。
7.一种语音指令的响应装置,其特征在于,包括:
接收模块,用于接收多操作指令;
获取模块,用于获取语音指令;
执行模块,用于执行所述语音指令对应的多步操作,所述多步操作包括基于至少一个应用的多步操作,所述多步操作与所述语音指令的对应关系由用户预先设置。
8.根据权利要求7所述的装置,其特征在于,还包括:
设置模块,用于接收设置指令;记录用户输入的所述语音指令;记录所述用户在选择的所述至少一个应用上执行的所述多步操作;建立所述多步操作与所述语音指令之间的对应关系。
9.根据权利要求7所述的装置,其特征在于,所述获取模块用于获取语音指令包括:
所述获取模块具体用于,接收语音信号;依据所述至少一个应用的名称,识别所述语音信号指示的所述语音指令。
10.根据权利要求9所述的装置,其特征在于,所述执行模块还用于:
在识别出所述语音信号指示的语音指令为第一应用的名称的情况下,执行基于所述第一应用的操作。
11.根据权利要求7-10所述的装置,其特征在于,所述执行模块用于执行所述语音指令对应的多步操作包括:
所述执行模块具体用于,在任意一个界面上,执行所述语音指令对应的多步操作。
CN201711083769.4A 2017-11-07 2017-11-07 一种语音指令的响应方法及装置 Pending CN107861706A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711083769.4A CN107861706A (zh) 2017-11-07 2017-11-07 一种语音指令的响应方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711083769.4A CN107861706A (zh) 2017-11-07 2017-11-07 一种语音指令的响应方法及装置

Publications (1)

Publication Number Publication Date
CN107861706A true CN107861706A (zh) 2018-03-30

Family

ID=61701147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711083769.4A Pending CN107861706A (zh) 2017-11-07 2017-11-07 一种语音指令的响应方法及装置

Country Status (1)

Country Link
CN (1) CN107861706A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020029094A1 (zh) * 2018-08-07 2020-02-13 华为技术有限公司 一种语音控制命令生成方法及终端
CN113791557A (zh) * 2018-05-18 2021-12-14 创新先进技术有限公司 一种智能设备的控制方法和装置
CN113900621A (zh) * 2021-11-09 2022-01-07 杭州逗酷软件科技有限公司 操作指令处理方法、控制方法、装置以及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103187078A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音式音乐控制装置
CN105882572A (zh) * 2015-02-16 2016-08-24 现代自动车株式会社 车辆及其控制方法
CN106648394A (zh) * 2016-12-31 2017-05-10 珠海市魅族科技有限公司 一种语音操控的方法及***
CN106898349A (zh) * 2017-01-11 2017-06-27 梅其珍 一种语音控制计算机的方法和智能语音助手***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103187078A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音式音乐控制装置
CN105882572A (zh) * 2015-02-16 2016-08-24 现代自动车株式会社 车辆及其控制方法
CN106648394A (zh) * 2016-12-31 2017-05-10 珠海市魅族科技有限公司 一种语音操控的方法及***
CN106898349A (zh) * 2017-01-11 2017-06-27 梅其珍 一种语音控制计算机的方法和智能语音助手***

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113791557A (zh) * 2018-05-18 2021-12-14 创新先进技术有限公司 一种智能设备的控制方法和装置
WO2020029094A1 (zh) * 2018-08-07 2020-02-13 华为技术有限公司 一种语音控制命令生成方法及终端
CN111742539A (zh) * 2018-08-07 2020-10-02 华为技术有限公司 一种语音控制命令生成方法及终端
JP2021532500A (ja) * 2018-08-07 2021-11-25 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 音声制御コマンド生成方法および端末
CN111742539B (zh) * 2018-08-07 2022-05-06 华为技术有限公司 一种语音控制命令生成方法及终端
JP7173670B2 (ja) 2018-08-07 2022-11-16 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 音声制御コマンド生成方法および端末
US11848016B2 (en) 2018-08-07 2023-12-19 Huawei Technologies Co., Ltd. Voice control command generation method and terminal
CN113900621A (zh) * 2021-11-09 2022-01-07 杭州逗酷软件科技有限公司 操作指令处理方法、控制方法、装置以及电子设备

Similar Documents

Publication Publication Date Title
KR101909807B1 (ko) 메시지 입력 방법 및 장치
US9161238B2 (en) Mobile device monitoring and testing
CN109697979B (zh) 语音助手技能添加方法、装置、存储介质及服务器
CN108733343B (zh) 生成语音控制指令的方法、装置及存储介质
US20090144051A1 (en) Method of providing personal dictionary
US8219502B2 (en) Automated interview systems and methods
US20150039307A1 (en) Interfacing device and method for supporting speech dialogue service
US7395206B1 (en) Systems and methods for managing and building directed dialogue portal applications
CN107861706A (zh) 一种语音指令的响应方法及装置
CN106357932A (zh) 一种通话信息记录方法和移动终端
CN104866308A (zh) 一种场景图像的生成方法及装置
CN110297616B (zh) 话术的生成方法、装置、设备以及存储介质
CN108460120A (zh) 数据保存方法、装置、终端设备及存储介质
CN103116483A (zh) 一种调用微博的方法、装置及终端
CN111899859A (zh) 手术器械清点方法及装置
CN105117400A (zh) 信息搜索方法和***
CN110349569A (zh) 定制化产品语言模型的训练和识别方法及装置
CN104349173A (zh) 视频复读方法及装置
Lee Voice user interface projects: build voice-enabled applications using dialogflow for *** home and Alexa skills kit for Amazon Echo
CN104378692A (zh) 一种处理视频字幕的方法及装置
CN103218157B (zh) 一种移动终端及解说信息的管理方法
CN111722893A (zh) 一种电子设备图形用户界面交互方法、装置和终端设备
CN105278928A (zh) Ivr对外接口配置方法及装置
CN102063193B (zh) 显示输入结果的方法及装置
CN109147791A (zh) 一种速记***和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190121

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: BEIJING ZIJIE TIAODONG NETWORK TECHNOLOGY CO., LTD.

Address before: 610051 Longtan Industrial Park, Second Section of East Ring Road, Chenghua District, Chengdu City, Sichuan Province

Applicant before: Chengdu - Digital Technology Co. Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20180330

RJ01 Rejection of invention patent application after publication