WO2017113738A1

WO2017113738A1 - 语音控制方法及其设备

Info

Publication number: WO2017113738A1
Application number: PCT/CN2016/089578
Authority: WO
Inventors: 王蕊; 崔洪贵
Original assignee: 乐视控股（北京）有限公司; 乐视致新电子科技（天津）有限公司
Priority date: 2015-12-30
Filing date: 2016-07-10
Publication date: 2017-07-06
Also published as: US20170193992A1; CN105912187A

Abstract

一种语音控制方法及其设备。包含以下步骤：根据采集到的语音信息生成用于执行的对应指令，并生成对应图形，对应图形用于显示对语音信息的识别结果；将生成的对应图形嵌入到视图页面中，在当前的人机交互界面中，显示根据最近一次采集的语音信息生成的对应图形；如果在人机交互界面中检测到手势滑动操作，则在人机交互界面中显示手势滑动操作所指示的对应图形，并执行该指示的对应图形的相应指令。采用本方法实施例，精简了人机交互界面，简化了操作流程，降低了用户操作成本，减小操作时对用户正常驾驶产生的影响。

Description

语音控制方法及其设备

交叉引用

本申请要求于2015年12月30日提交中国专利局、申请号为201511031185.3的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本专利申请涉及通信领域，特别涉及语音控制技术。

背景技术

发明人在实现本发明的过程中发现，移动应用市场中传统的智能语音识别类的产品首页以内容的堆积为主，多采取对话的形式进行交互。在对录音状态和待机状态进行切换时多采用点击触发按钮的方式，在界面中充斥着过多文字信息或语义识别之后执行的内容操作，对于车载状态的用户如果需要从语音识别结果页面或者语义执行界面跳转回到录音状态，需要进行复杂的操作才能完成。

然而行驶状态的用户对于信息的获取要求更加苛刻，过多的冗余信息，过于复杂的交互界面都会提高用户的操作成本，增加用户的操作时间，影响驾驶状态的正常进行，从而使得这种用户界面并不能很好的适用于车载产品中。

发明内容

本发明部分实施例的目的在于提供一种语音控制方法及其设备，精简了人机交互界面，简化了操作流程，降低用户操作成本，减小对用户正常驾驶产生的影响。

为解决上述技术问题，本发明的实施方式提供了一种语音控制方法，包含以下步骤：根据采集到的语音信息生成用于执行的对应指令，并生成对应图形，对应图形用于显示对语音信息的识别结果；将生成的对应图形嵌入到视图页面中，在当前的人机交互界面中，显示根据最近一次采集的语音信息生成的对应图形；如果在人机交互界面中检测到手势滑动操作，则在人机交互界面中显示手势滑动操作所指示的对应图形，并执行该指示的对应图形的相应指令。

本发明的实施方式还提供了一种语音控制设备，包含：指令生成模块，用于根据采集到的语音信息生成对应指令；指令执行模块，用于执行指令生成模块生成的对应指令；图形生成模块，用于根据采集到的语音信息生成对应图形，对应图形用于显示对语音信息的识别结果；嵌入模块，用于将生成的对应图形嵌入到视图页面中；显示模块，用于在当前的人机交互界面中，显示根据最近一次采集的语音信息生成的对应图形；手势检测模块，用于检测在人机交互界面中是否有手势滑动操作；手势检测模块在检测到手势滑动操作时，触发显示模块在人机交互界面中显示手势滑动操作所指示的对应图形，并触发指令执行模块执行该指示的对应图形的相应指令。

本发明实施方式相对于现有技术而言，通过采集语音信息并对其进行识别生成用于执行的对应指令和显示语音信息的识别结果的对应图形，对应图形嵌入到视图页面中，并可在人机交互界面中，显示最近一次采集的语音信息生成的对应图形，若在人机交互界面中检测到手势滑动操作，则在人机交互界面中显示手势滑动所对应的图形，并执行该指示图形的相应指令。利用人机交互界面操作中滑动屏幕时产生的加速度滑动效果，对界面的相对位移距离进行判断，从而执行不同的响应，简化了用户操作流程，减小操作车载设备时对用户正常驾驶产生的影响。

在一个实施例中，不同语音信息生成不同的对应图形；各对应图形并排嵌入到视图页面中；在人机交互界面中显示手势滑动操作所指示的对应图形的步骤中，根据手势滑动操作的滑动方向，显示当前显示的对应图形左侧或右侧的对应图形。各对应图形并排嵌入到视图页面中，并随着手势滑动的方向，显示出对应的图像，有效的简化了用户操作。

在一个实施例中，各对应图形根据相应的语音信息的采集顺序，以从左至右的顺序并排嵌入到视图页面中。采用从左至右的顺序并排嵌入到视图页面，配合手势滑动操作选择不同的对应画面，符合用户的操作习惯。

在一个实施例中，执行对应指令的步骤中，包含以下子步骤：车载设备将指令发送至关联终端；关联终端执行指令，并将该指令的执行结果反馈至车载设备；车载设备将收到的执行结果显示在人机交互界面中。其中，关联终端可以为手机，关联方式可以为蓝牙关联，通过手机终端和车载设备的信息交互，手机终端将执行结果反馈至车载设备，并在在人机交互界面中显示显示执行结果，用户可以比较直观的从人机交互界面上获取到执行结果。

在一个实施例中，人机交互界面划分为第一显示区域和第二显示区域；对应图形显示在第一显示区域；执行结果显示在第二显示区域。将人机交互界面划分成两个区域，并在各区域内显示相应的内容，简化了人机交互界面风格，使得人机交互面上的内容变得一目了然，尤其是用于车载设备中，有效的精简了冗余信息，方便用户快速的获取信息。

在一个实施例中，第一显示区域的背景色不同于第二显示区域的背景色。两个区域使用不同的背景色，使得两区域界限分明，用户可以直接通过背景色迅速定位到所需信息的区域位置，缩短用户定位信息所在区域的时间。

在一个实施例中，第一显示区域与第二显示区域的面积可调。如果接收到对第一显示区域或第二显示区域的面积调整操作，则根据接收到的面积调整操作，调整区域面积。用户可以根据视图习惯，对显示区域的面积进行调整，使得人机交互界面更加灵活、合理，提高了用户体验。

在一个实施例中，人机交互界面中预设有用于触发语音识别功能的按键；在根据采集到的语音信息生成用于执行的对应指令的步骤之前，还包含：如果检测到对按键的操作，则利用语音采集设备采集语音。考虑到用户实际操作的灵活性和随机性，增设用于触发语音识别功能的按键，确保语音信息采集过程的正确性与合理性。

附图说明

图1是根据本发明第一实施方式的语音控制方法的流程图；

图2是根据本发明第一实施方式、第二实施方式和第三实施方式的人机交互界面示意图；

图3是根据本发明第一实施方式、第二实施方式和第三实施方式中手势滑动操作的滑动方向为从左向右时对应的图形切换示意图；

图4是根据本发明第一实施方式、第二实施方式和第三实施方式中根据手势滑动操作将显示的图形切换至图形A的示意图；

图5是根据本发明第四实施方式语音控制设备的***结构图。

具体实施方式

为使本发明部分实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的各实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本发明各实施方式中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施方式的种种变化和修改，也可以实现本申请各权利要求所要求保护的技术方案。

本发明的第一实施方式涉及一种语音控制方法，本实施方式应用于车载设备，具体流程如图1所示。

在步骤101中，判断是否检测到语音识别按键操作。具体地说，在车载设备的人机交互界面(如触控屏)中预设有用于触发语音识别功能的按键。若未检测到用户对该按键的操作，则回到起始状态，继续检测用户是否对该用于触发语音识别功能的按键进行操作；

如果检测到有对该按键进行操作(如检测到对该按键进行了点击)，则进入步骤102，车载设备利用语音采集设备采集语音信息，比如说，利用设置于该车载设备上的麦克风采集语音信息。

在本实施方式中，考虑到用户实际操作的灵活性和随机性，设置有用于触发语音识别功能的按键，只有当检测到该按键***作时，才会启动语音采集设备采集语音，确保语音信息采集过程的正确性与合理性。

接着，进入步骤103，生成对应指令和对应图形。采集到的语音信息生成用于执行的对应指令，并生成对应图形，对应图形用于显示对语音信息的识别结果，比如图形为字样“给李某某打电话”。不同的语音信息生成不同的对应图形。各对应图形及对应指令可保存在车载设备中，当调出各语音信息对应图形的时即可同时调出对应指令。具体的说，各对应图形并排嵌入到视图页面中，比如说，各对应图形根据相应的语音信息的采集顺序，以从左至右的顺序并排嵌入到视图页面中，并在当前人机交互界面中，显示根据最近一次采集的语音信息生成的对应图形，如图2所示。其中，人机交互界面以实线边框表示，C为当前人机交互界面显示的对应图形，B为当前对应图形C上一条语音信息的对应图形，A为图形B的上一条语音信息对应的图形。将最近一次的语音信息生成的对应图形显示在当前的人机交互界面中，方便用户直观的了解当前的操作。

比如说，整个人机交互界面(例如APP)以一个视图页面的形式存在，用户单次换起语音信息识别指令时，在该语音视图中生成一个对应图形，用于展示单次语音信息识别与语义理解的内容，当用户再次发起语音信息识别指令时，则继续生成另一个对应图形，以此方式完成发起的各语音信息识别指令，并生成与之相对应图形，各对应图形根据相应的语音信息的采集顺序，以从左至右的顺序并排嵌入到视图页面中，符合用户的操作习惯。

在本实施方式中，人机交互界面划分为第一显示区域和第二显示区域；对应图形显示在第一显示区域；执行结果显示在第二显示区域。如图2所示，人机交互界面以实线边框表示，上端区域Ⅰ为第一显示区域，用于显示对应图形，下端区域Ⅱ为第二显示区域，用于显示执行结果。将人机交互界面划分成两个区域，并在各区域内显示相应的内容。简化了人机交互界面风格，精简了人机交互界面上的显示信息，去除了冗余信息，使得人机交互面上的内容变得一目了然，尤其是用于车载设备中，方便用户快速的获取信息，尽可能地减少了对驾驶的影响。

接着，进入步骤104，获取待执行指令。一般执行指令的获取有以下两种情况：

一、车载设备将当前人机交互界面中显示的最近一次语音信息对应指令作为待执行指令。

二、通过手势滑动人机交互界面获取。由于在车载设备中储存有之前语音信息操作产生的对应图形及对应指令，为了提高用户体验，方便用户操作，用户可以通过手势滑动人机交互界面，从车载设备中获取所需的指令。如果在人机交互界面中检测到手势滑动操作，则在人机交互界面中显示手势滑动操作所指示的对应图形，将该对应图形的相应指令作为待执行指令。

具体的说，用户通过手势操作在人机交互界面上平行滑动，即可切换出当前显示的图形的左侧或者右侧的图形，并调出对应指令。如图3所示，用户从左向右滑动人机交互界面时，可从图形C切换到前一条语音信息所对应图形B，人机交互界面以实线边框表示，且切换完成后，人机交互界面显示的图形即为B；如果此时，用户继续从左向右滑动人机交互界面，则将图形B切换到图形B之前的一条语音信息所对应图形A，如图4所示。相应的，如果用户从右向左滑动人机交互界面时，即可将图形A再切换至图形A的后一条语音信息所对应的图形B。用户通过手势滑动人机交互界面即可实现语音信息指令的切换，简化了用户操作流程。在本步骤中，车载设备获取的待执行指令即为用户停止手势滑动操作时，该人机交互界面当前显示的图形所对应的指令。

接着，进入步骤105，判断是否需要关联终端执行指令。若判断结果为否，即不需要关联终端执行指令，进入步骤106，车载设备执行获取的指令，并将执行结果显示在人机交互界面中。

若需要关联终端执行指令，即判断结果为是，进入步骤107，车载设备将对应指令发送至关联终端。关联终端可以为手机，手机可以通过蓝牙配对的方式与车载设备进行关联，在本步骤中，车载设备即可通过蓝牙将指令发送给手机。

接着，进入步骤108，关联终端执行指令，并将执行结果反馈到车载设备。用户既可通过终端来执行指令(如拨打电话)，又可通过车载设备执行指令，灵活性较大，在驾驶过程中，方便用户根据实际情况进行合理选择。

接着，进入步骤109，车载设备将收到的执行结果显示在人机交互界面中，方便用户查看当前执行的操作。

不难发现，在本实施方式中，通过采集语音信息，并生成对应指令和对应图形，将生成的对应图形嵌入到视图页面中，并将最近一次采集的语音信息生成的对应图形显示在当前的人机交互界面中。此外，根据手势滑动操作人机交互界面，实现对语音信息指令的切换及选择。利用人机交互界面操作中滑动屏幕时产生的加速度滑动效果，对界面的相对位移距离进行判断，从而执行不同的响应，简化了用户操作流程，减小操作车载设备时对用户正常驾驶产生的影响。

本发明的第二实施方式涉及一种语音控制方法。第二实施方式在第一实施方式的基础上进行了改进，主要改进之处在于：第一显示区域的背景色不同于第二显示区域的背景色。比如说，第一显示区域的背景色为黑色，第二显示区域的背景色为白色，两个区域分别使用黑色和白色两种截然不同的背景色，使得两区域界限分明，用户可以直接根据背景色迅速定位到所需信息的区域位置，缩短用户定位所需信息所在位置的时间。

本发明的第三实施方式涉及一种语音控制方法。第三实施方式在第一、第二实施方式的基础上进行了改进，主要改进之处在于：第一显示区域与第二显示区域的面积可调。如果接收到对第一显示区域或第二显示区域的面积调整操作，则根据接收到的面积调整操作，调整区域面积。在实际操作过程中，用户可以通过手动拖动第一显示区域或者第二显示区域的边框，直到达到合适的位置，两个显示区域的高度随着用户的拖动而变化，以此调整两个显示区域在人机交互界面中的显示比例。用户可以根据视图习惯，灵活、合理的对显示区域的面积进行调整，满足不同用户的视图需求。

上面各种方法的步骤划分，只是为了描述清楚，实现时可以合并为一个步骤或者对某些步骤进行拆分，分解为多个步骤，只要包含相同的逻辑关系，都在本专利的保护范围内；对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计，但不改变其算法和流程的核心设计都在该专利的保护范围内。

本发明第四实施方式涉及一种语音控制设备，如图5所示，包含：指令生成模块，用于根据采集到的语音信息生成对应指令；指令执行模块，用于执行指令生成模块生成的对应指令；图形生成模块，用于根据采集到的语音信息生成对应图形，对应图形用于显示对语音信息的识别结果；嵌入模块，用于将生成的对应图形嵌入到视图页面中；显示模块，用于在当前的人机交互界面中，显示根据最近一次采集的语音信息生成的对应图形；手势检测模块，用于检测在人机交互界面中是否有手势滑动操作；手势检测模块在检测到手势滑动操作时，触发显示模块在人机交互界面中显示手势滑动操作所指示的对应图形，并触发指令执行模块执行该指示的对应图形的相应指令。

不难发现，本实施方式为与第一实施方式相对应的设备实施例，本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效，为了减少重复，这里不再赘述。相应地，本实施方式中提到的相关技术细节也可应用在第一实施方式中。

值得一提的是，本实施方式中所涉及到的各模块均为逻辑模块，在实际应用中，一个逻辑单元可以是一个物理单元，也可以是一个物理单元的一部分，还可以以多个物理单元的组合实现。此外，为了突出本发明的创新部分，本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入，但这并不表明本实施方式中不存在其它的单元。

本领域的普通技术人员可以理解，上述各实施方式是实现本发明的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本发明的精神和范围。

Claims

一种语音控制方法，包含以下步骤：

根据采集到的语音信息生成用于执行的对应指令，并生成对应图形，所述对应图形用于显示对所述语音信息的识别结果；

将所述生成的对应图形嵌入到视图页面中，在当前的人机交互界面中，显示根据最近一次采集的语音信息生成的对应图形；

如果在所述人机交互界面中检测到手势滑动操作，则在所述人机交互界面中显示所述手势滑动操作所指示的对应图形，并执行该指示的对应图形的相应指令。
根据权利要求1所述的语音控制方法，其中，

不同语音信息生成不同的所述对应图形；

所述各对应图形并排嵌入到所述视图页面中；

在所述人机交互界面中显示所述手势滑动操作所指示的对应图形的步骤中，根据所述手势滑动操作的滑动方向，显示当前显示的对应图形左侧或右侧的对应图形。
根据权利要求2所述的语音控制方法，其中，

所述各对应图形根据相应的语音信息的采集顺序，以从左至右的顺序并排嵌入到所述视图页面中。
根据权利要求1至3任一项所述的语音控制方法，其中，所述语音控制方法应用于车载设备。
根据权利要求4所述的语音控制方法，其中，所述执行对应指令的步骤中，包含以下子步骤：

所述车载设备将所述指令发送至关联终端；

所述关联终端执行所述指令，并将该指令的执行结果反馈至所述车载设备；

所述车载设备将收到的所述执行结果显示在人机交互界面中。
根据权利要求5所述的语音控制方法，其中，所述人机交互界面划分为第一显示区域和第二显示区域；

所述对应图形显示在所述第一显示区域；

所述执行结果显示在所述第二显示区域。
根据权利要求6所述的语音控制方法，其中，所述第一显示区域的背景色不同于所述第二显示区域的背景色。
根据权利要求6或7所述的语音控制方法，其中，所述第一显示区域与所述第二显示区域的面积可调。

如果接收到对所述第一显示区域或所述第二显示区域的面积调整操作，则根据接收到的所述面积调整操作，调整区域面积。
根据权利要求1至8中任一项所述的语音控制方法，其中，所述人机交互界面中预设有用于触发语音识别功能的按键；

在所述根据采集到的语音信息生成用于执行的对应指令的步骤之前，还包含：

如果检测到对所述按键的操作，则利用语音采集设备采集语音。
一种语音控制设备，包含：

指令生成模块，用于根据采集到的语音信息生成对应指令；

指令执行模块，用于执行所述指令生成模块生成的对应指令；

图形生成模块，用于根据采集到的语音信息生成对应图形，所述对应图形用于显示对所述语音信息的识别结果；

嵌入模块，用于将所述生成的对应图形嵌入到视图页面中；

显示模块，用于在当前的人机交互界面中，显示根据最近一次采集的语音信息生成的对应图形；

手势检测模块，用于检测在所述人机交互界面中是否有手势滑动操作；

所述手势检测模块在检测到手势滑动操作时，触发所述显示模块在所述人机交互界面中显示所述手势滑动操作所指示的对应图形，并触发所述指令执行模块执行该指示的对应图形的相应指令。