CN110570846B - 一种语音控制方法、装置及手机 - Google Patents

一种语音控制方法、装置及手机 Download PDF

Info

Publication number
CN110570846B
CN110570846B CN201810569218.7A CN201810569218A CN110570846B CN 110570846 B CN110570846 B CN 110570846B CN 201810569218 A CN201810569218 A CN 201810569218A CN 110570846 B CN110570846 B CN 110570846B
Authority
CN
China
Prior art keywords
control
identification code
preset
voice
screen information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810569218.7A
Other languages
English (en)
Other versions
CN110570846A (zh
Inventor
姜绍宇
宋亮
李凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Mobile Communications Technology Co Ltd
Original Assignee
Hisense Mobile Communications Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Mobile Communications Technology Co Ltd filed Critical Hisense Mobile Communications Technology Co Ltd
Priority to CN201810569218.7A priority Critical patent/CN110570846B/zh
Publication of CN110570846A publication Critical patent/CN110570846A/zh
Application granted granted Critical
Publication of CN110570846B publication Critical patent/CN110570846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供了一种语音控制方法、装置及手机,包括:获取包含控制指令的语音,解析所述语音中包含的控制指令;获取与所述控制指令相匹配控件的预置识别码;获取终端当前操作界面的屏幕信息,判断是否从所述屏幕信息中找到与所述预置识别码相同的控件;若从所述屏幕信息中找到与所述预置识别码相同的控件,则模拟点击所述控件;若未能从所述屏幕信息中找到与所述预置识别码相同的控件,根据所述用户操作过程中所点击控件的识别码更新所述预置识别码。本申请提供的语音控制方法、装置及手机,当控件的text或ID等识别码发生变化时,实现了本地预置识别码的自主更新,解决因控件的text或ID等识别码发生变化而产生无法完成模拟点击的问题。

Description

一种语音控制方法、装置及手机
技术领域
本申请涉及移动通讯技术领域,尤其涉及一种语音控制方法、装置及手机。
背景技术
目前随着语音识别技术的发展,基于语音识别功能的手机语音控制越来越受到手机用户的青睐。手机语音控制是指用户通过语音控制模拟人的操作,从而代替按键、触摸等操作手机,可用于解放用户的双手,更加便于手机的使用。
现有的手机语音控制,需要将代表控件属性的text或ID等识别码预先设置到智能语音数据库中,text为控件的值,ID为标识控件的唯一标识符,text或ID等识别码用于相应控件的唯一识别。在使用的时候,接收用户的输入语音,解析所述语音获得所述语音中的控制指令,根据所述控制指令查找所述智能语音数据库,获取与所述控制指令相匹配的控件的text或ID等识别码,根据所述获取到的text或ID等识别码在当前屏幕中查找相应的控件,模拟点击,完成语音控制。如,用户输入语音“给张三发微信说明天一块开会”,接收所述语音,解析所述语音获得“打开微信,找到联系人张三,输入‘明天一起开会’并发送”等的控制指令,当发送时,根据发送控制指令查找并获取智能语音数据库中关于发送的text或ID,根据获取到的text或ID查找当前屏幕中与所述text或ID相同的控件,模拟点击所述控件,执行发送。
然而,随着应用软件的升级,控件的text或ID等识别码可能会发生变化。若控件的text或ID等识别码发生变化,当根据获取到的控制指令查找智能语音数据库中相应控件的text或ID等识别码时,由于智能语音数据库中保存的是预先设置变化前的控件的text或ID等识别码。因此当根据获取到的控件的text或ID等识别码去查找当前屏幕中的控件时,将无法找到与变化前的控件的text或ID等识别码相配的控件,无法完成模拟点击,使语音控制不能进一步执行。
发明内容
本申请提供了一种语音控制方法、装置及手机,当控件的text或ID等识别码发生变化时,实现自主更新所述控件的text或ID等识别码,解决因控件的text或ID等识别码发生变化而产生无法完成模拟点击的问题。
第一方面,本申请提供了一种语音控制方法,所述方法包括:
获取包含控制指令的语音,解析所述语音中包含的控制指令;
根据所述控制指令,获取与所述控制指令相匹配控件的预置识别码;
获取终端当前操作界面的屏幕信息,根据所述预置识别码查找所述屏幕信息;
判断是否从所述屏幕信息中找到与所述预置识别码相同的控件;
若从所述屏幕信息中找到与所述预置识别码相同的控件,则模拟点击所述控件;
若未能从所述屏幕信息中找到与所述预置识别码相同的控件,则获取用户手动操作过程中所点击控件的识别码,根据所述用户操作过程中所点击控件的识别码更新所述预置识别码。
第二方面,本申请还提供了一种语音控制装置,所述控制装置包括处理器和存储器;
所述存储器,用于存储程序代码;
所述处理器,用于读取所述存储器中存储的程序代码,并作为具体部件执行上述所述的语音控制方法。
第三方面,本申请还提供了一种手机,所述手机包括语音控制装置,所述语音控制装置为上述所述的语音控制装置。
本申请提供的一种语音控制方法、装置及手机,用于实现终端的语音控制。具体的:根据解析出的控制指令获取与所述控制指令相匹配控件的预置识别码,获取终端当前操作界面的屏幕信息,在所述屏幕信息中查找与所述预置识别码相同的控件,若能查找到与预置识别码相同的控件,则模拟点击所述控件;若是未能查找到与预置识别码相同的控件,通过获取用户手动操作过程中所点击控件的识别码,并根据其更新所述预置识别码。因此,本申请提供的语音控制方法,当控件的识别码发生变化时,实现了本地预置识别码的自主更新,解决因控件的识别码发生变化而产生无法完成模拟点击的问题。本申请提供的语音控制方法,实现语音控制的自学习,可以有效自主扩展所需要控件的识别码。
本申请提供的语音控制装置,用于语音控制方法的具体执行。本申请提供的语音控制装置可用于智能手机、电视等终端设备。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一提供的语音控制方法的结构流程图;
图2为本申请实施例二提供的语音控制方法的结构流程图;
图3为本申请实施例提供的语音控制方法的使用状态图;
图4为本申请实施例提供的语音控制装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在建立智能语音数据库时,将当时能获取到的控件的text或ID等识别码预先设置到所述智能语音数据库中。若***作的控件后期更新了其text或ID等识别码,就会导致智能语音控制该控件操作功能的失效,为便于语音识别使用,通常定期更新智能语音数据库,如更新控件的text或ID等识别码。且智能语音数据库的更新主要通过运营商,终端需要升级才能不断适配新的应用,运营商的更新的周期往往相对较长且时间不定,较容易导致语音控制不能正常执行。
附图1为本申请实施例一提供的一种语音控制方法的流程图。如附图1所示,本申请实施例一提供的语音控制方法,包括:
S100:获取包含控制指令的语音,解析所述语音中包含的控制指令。
启动语音控制后,获取用户给予的包含控制指令的语音。其中,语音控制通过接收启动信号进行启动,启动信号可通过长按终端设备某个物理键产生,物理键如手机的Home键。当接收到用户给予的包含控制指令的语音后,解析所述语音获得所述语音中包含的控制指令。解析语音中包含的控制指令,通常是结合智能语音库截取所接收语音中的关键词并进行关键词的拼接。
S200:根据所述控制指令,获取与所述控制指令相匹配控件的预置识别码。
在解析获取到的语音后获得控制指令,根据所述控制指令查找智能语音数据库,与智能语音数据库中预置了识别码的控件进行匹配,获得与所述控制指令相匹配控件的预置识别码。其中,所述识别码为text或ID等代表控件属性的特征值。
S300:获取终端当前操作界面的屏幕信息,根据所述预置识别码查找所述屏幕信息。
读取终端当前操作界面,获取终端当前操作界面的屏幕信息。在本申请具体实施方式中,基于辅助功能获取终端当前操作界面的屏幕信息。从获得的当前操作界面的屏幕信息查找预置识别码,即从当前操作界面的屏幕信息中查找与所述预置识别码相匹配的控件。
辅助功能(Accessbility),是Android官方推出帮助身体不便或者操作不灵活的人来辅助操作手机应用的。本申请中通过辅助功能获取终端当前操作界面的屏幕信息,具体可通过调用Accessbility提供的接口,获取当前操作界面的屏幕信息。如:
调用getRootInActiveWindow获取当前的操作界面的屏幕信息
AccessibilityNodeInfo nodeInfo=getRootInActiveWindow();
这个NodeInfo就是一个当前屏幕信息的一个合集类。
当前操作界面的屏幕信息包括界面上的文字、图片、控件Text、ID、Clickable等均为控件的属性。Text为控件的值;ID为用于标识控件的唯一标识符,Clickable表示该控件是否可点击,当Clickable为false时,表示不能点击。
S400:判断是否从所述屏幕信息中找到与所述预置识别码相同的控件。
从获取到的终端当前操作界面的屏幕信息中查找与所述控制指令相匹配控件的预置识别码,判断是否从所述屏幕信息中找到与所述预置识别码相同的控件。如,从获取到的终端当前操作界面的屏幕信息中查找与所述控制指令相匹配控件的预置text或预置ID,判断是否从所述屏幕信息中找到与所述预置text或预置ID相同的控件
具体的,根据与所述控制指令相匹配控件的预置text或ID,调用辅助功能的公开接口,查找前操作界面的屏幕信息中与所述预置text或ID相匹配的控件,在查找后返回查找列表。查找列表为根据获得的预置text或ID查找前操作界面的屏幕信息生成的表格。当查找到与所述预置text或ID相匹配的控件时,返回的查找列表不为空,当未查找到与所述预置text或ID相匹配的控件时,返回的查找列表为空。判断返回的查找列表是否为空,即可获知是否从所述屏幕信息中找到与所述预置text或ID相同的控件。
以查找text为“发送”的控件为例:
List<AccessibilityNodeInfo>list=nodeInfo
.findAccessibilityNodeInfosByText("发送")
以查找ID为“aac”的控件为例:
List<AccessibilityNodeInfo>content=nodeInfo2
.findAccessibilityNodeInfosByViewId("com.tencent.mm:id/aac")
当从所述屏幕信息中找到与所述预置text或ID相同的控件时,执行步骤S401;当未从所述屏幕信息中找到与所述预置text或ID相同的控件时,执行步骤S402。
S401:若从所述屏幕信息中找到与所述预置识别码相同的控件,则模拟点击所述控件。
当从所述屏幕信息中找到与所述识别码相同的控件时,模拟点击从屏幕信息中找到的控件,即完成语音控制。
如,当从所述屏幕信息中找到与所述预置text或预置ID相同的控件时,模拟点击从屏幕信息中找到的控件,即完成语音控制。
模拟点击过程如下:
n.performAction(AccessibilityNodeInfo.ACTION_CLICK)
n代表通过text或者id查找到出来的List<AccessibilityNodeInfo>对象
S402:若未能从所述屏幕信息中找到与所述预置识别码相同的控件,则获取用户手动操作过程中所点击控件的识别码,根据所述用户操作过程中所点击控件的识别码更新所述预置识别码。
如,当未从所述屏幕信息中找到与所述预置text或预置ID相同的控件时,即控件的text或ID发生了变化,不再是预先设置在智能语音数据库中的text或ID。如此,将不能继续执行模拟点击实现语音控制,为能继续执行操作控制,需要用户进行手动操作。
当用户采用手动操作进行继续执行时,获取用户手动操作过程中所点击控件的text或ID,根据所述用户操作过程中所点击控件的text或ID更新所述预置text或预置ID,实现语音控制的自学习。如此,通过语音控制的自学习,实现本地预置text或预置ID的更新。当后续再遇到相同语音的控制指令时,将会从本地智能语音数据库中更新后控件的text或ID,将能够根据更新后的控件的text或ID从当前操作界面的屏幕信息找到与所述预置text或ID相同的控件,可进行控件模拟点击,将不会出现因为控件的预置text或ID发生变化而导致无法模拟点击现象的发生。
例如,用户输入语音“给张三发微信说明天一块开会”,接收所述语音,解析所述语音获得“打开微信,找到联系人张三,输入‘明天一起开会’并发送”等的控制指令,如此根据控制指令依次执行打开微信——找到联系人张三——输入“明天一起开会”——发送。假如,控件“发送”的ID发送变化,如控件“发送”预先设置到智能语音数据库的ID为“[204,187][104,361]”,变化后的控件“发送”的ID为“[216,187][104,257]”。如此,当执行“发送”的时候,先从智能语音数据库查找出与发送控制命令相匹配控件“发送”的ID,即获得“发送[204,187][104,361]”,在当前操作界面的屏幕信息中查找“发送[204,187][104,361]”,因为控件“发送”的ID已变化为“[216,187][104,257]”,所以无法查找到“发送[204,187][104,361]”,因而无法模拟点击控件“发送”。当用户采用手动操作继续执行点击“发送”,获取用户所点击的“发送[216,187][104,257]”,根据用户所点击的“发送[216,187][104,257]”更新预置的“发送[204,187][104,361]”,即“发送[216,187][104,257]”替换“发送[204,187][104,361],完成控件“发送”ID的更新,实现语音操作的自学习。当后续再遇到相同语音的“发送”控制指令时,先从智能语音数据库查找出与发送控制命令相匹配控件“发送[216,187][104,257]”,在当前操作界面的屏幕信息中可查找到“发送[216,187][104,257]”,模拟点击从屏幕信息中找到的控件“发送[216,187][104,257]”,即完成语音控制。
本申请实施例提供的语音控制方法,根据解析出的控制指令获取与所述控制指令相匹配控件的预置识别码,获取终端当前操作界面的屏幕信息,在所述屏幕信息中查找与所述预置识别码相同的控件,若能查找到与预置识别码相同的控件,则模拟点击所述控件;若是未能查找到与预置识别码相同的控件,通过获取用户手动操作过程中所点击控件的识别码,并根据其更新所述预置识别码。本申请实施例提供的语音控制方法,用于实现终端的语音控制,并能当控件的识别码发生变化时,实现了本地预置识别码的自主更新,解决因控件的识别码发生变化而产生无法完成模拟点击的问题。本申请提供的语音控制方法,实现语音控制的自学习,可以有效自主扩展所需要控件的识别码。
图2为本申请实施例二提供的一种语音控制方法的流程图。如附图2所示,在本申请具体实施方式中,本申请实施例提供的语音控制方法,在所述根据所述控制指令,获取与所述控制指令相匹配控件的预置识别码前,所述方法还包括:
S500:匹配解析出的控制指令和预置词条,判断解析出的控制指令是否符合预置词条。
S501:当解析出的控制指令符合预置词条时,根据所述预置词条拆分解析出的控制指令,获得若干相应控制指令。
预置词条是预先设置词条,通常用于表示若干个控制指令,记录其中每一个相关步骤的控制指令。如,预置词条“查看朋友圈”记录“进入微信”、“点击发现”和“点击朋友圈”三个步骤的控制指令。
在解析出语音中所包含的语音指令后,先进行所述语音指令与预置词条的匹配,判断解析出的控制指令是否符合预置词条,即判断预置词条中是否包含所述解析出的控制指令,当解析出的控制指令符合预置词条或预置词条中包含所述解析出的控制指令,根据预置词条拆分解析出的若干相应控制指令,根据拆分出的控制指令依次获取与所述控制指令相匹配控件的预置识别码,并依次获取相应操作界面的屏幕信息并根据相应预置识别码查找所述屏幕信息,依次去执行拆分出的每一个控制指令。当无法从屏幕信息找到预置词条对应的某一个控制指令时,进行此控制指令对应预置识别码的更新,实现语音控制的自学习。
基于上述实施例提供的语音控制方法,用户可在桌面当前操作界面直接说“查看朋友圈”,语音控制***根据预置词条“查看朋友圈”记录的“进入微信”、“点击发现”和“点击朋友圈”步骤的控制指令,分别获取“微信”、“发现”以及“朋友圈”的预置识别码,然后获取当前桌面的屏幕信息,从桌面的屏幕信息中查找与“微信”的预置识别码相对应的控件,模拟点击所述控件;进入微信界面后,获取微信界面的屏幕信息,从微信界面的屏幕信息查找与“发现”的预置识别码相对应的控件,模拟点击所述控件;进入发现界面后,获取发现界面的屏幕信息,从发现界面的屏幕信息查找“朋友圈”的预置识别码相对应的控件,模拟点击所述控件,完成进入朋友圈,达到查看朋友圈的操作。上述“查看朋友圈”具体过程如附图3所示。
当“进入微信”、“点击发现”和“点击朋友圈”中任意一个控制指令对应的识别码发生变化的时候,进行该控制指令对应匹配预置识别码的更新,然后继续执行后续控制指令,直至语音控制结束。如,微信界面的屏幕信息中控件“发现”的识别码发生变化,当根据“发现”的预置识别码在微信界面的屏幕信息中查找时,将无法查找到,则获取用户手动操作过程中所点击控件的识别码,开启“点击发现”相对应控制指令操作的自学习,根据所述用户操作过程中所点击控件的识别码更新所述预置识别码;并在发现界面继续执行点击“朋友圈”的语音操作,若是能够找到相应“朋友圈”的预置识别码则进行点击,若是无法找到重复上述的操作进行“点击朋友圈”相对应控制指令操作的自学习。
进一步,在本申请具体实施方式中,若未能从所述屏幕信息中找到与所述预置text或预置ID相同的控件,提示用户手动操作,根据用户手动操作获取用户手动操作过程中所点击控件的text或ID,根据所述用户操作过程中所点击控件的text或ID更新所述预置text或预置ID。
如,当在终端当前操作界面无法查找到“发送[204,187][104,361]”时,提示用户“请手动点击发送”,起到了提醒用户无法正常找到控件“发送”的作用,便于用户及时获知语音控制无法模拟点击控件“发送”并及时手动点击控件“发送”。
如此,可有助于给予用户警示,便于用户进一步执行控制,提高控制的效率;同时,因为提示用户进行手动操作,便于针对其提示的手动操作去进行手动操作,有助于提高更新预置text或预置ID的准确性。
在本申请具体实施方式中,在根据所述用户操作过程中所点击控件的text或ID更新所述预置text或预置ID时,提醒用户是否更新所述预置text或预置ID,当接收到更新所述预置text或预置ID的信号时,获取用户操作过程中所点击控件的text或ID,根据所述用户操作过程中所点击控件的text或ID更新所述预置text或预置ID。
在根据所述用户操作过程中所点击控件的text或ID更新所述预置text或预置ID前,提醒用户是否更新,提高更新预置text或预置ID的自主性。且若发生用户执行手动操作点击的控件内容并不是语音控制所需点击的控件时,先进行提醒,可防止相互不匹配控件预置text或预置ID被更新,提高预置text或预置ID被更新的准确性。
具体的,可弹出“是否更新XX控件预置text(预置ID)”窗口,当用户点击“是”时,则会接收到更新控件“XX”预置text(预置ID)的信号,进行获取用户操作过程中所点击控件的text或ID,根据所述用户操作过程中所点击控件的text或ID更新所述控件“XX”预置text或预置ID;当用户点击“否”时,则不会接收到更新控件“XX”预置text或预置ID的信号,将不会进行获取用户操作过程中所点击控件的text或ID以及更新。
如,提醒用户是否更新控件“发送”的预置text或预置ID,若是用户点击“是”,则会接收到更新控件“发送”的预置text或预置ID的信号,从屏幕信息中获取控件“发送”的text或ID信息(发送[216,187][104,257]),将屏幕信息中获取到的“发送”的text或ID信息替换原控件“发送”的预置text或ID,实现控件“发送”的预置text或预置ID的更新;如是用户点击“否”,则不会进行控件“发送”的预置text或预置ID的更新。
进一步,在本申请具体实施方式中,获取用户手动操作过程中所点击控件的text或ID,包括:基于窗口管理(Windows Manager)服务获取用户手动操作过程中所点击控件的text或ID。即,通过终端操作***的Windows Manager服务获取用户操作过程中所点击控件的ID或者text。Windows Manager是终端操作***的一个服务,他实际是View的直接管理者,所以可以通过Windows Manager来获取用所点击控件的ID或text。
在本申请具体实施方式中,本申请提供的语音控制方法还包括提醒用户所述控件的text或ID已更新。具体的,当根据所述用户操作过程中所点击控件的text或ID更新所述预置text或预置ID后,提醒用户所述控件的text或ID已更新。
与上述实施例提供的一种语音控制方法相对应,本申请实施例还提供了一种语音控制装置的实施例,语音控制装置的结构如附图4所示。本申请实施例提供的语音控制装置可用于智能手机、电视等终端设备。
本申请实施例提供的语音控制装置600,包括处理器601和存储器602;
所述存储器602,用于存储程序代码;
所述处理器601,用于读取所述存储器602中存储的程序代码,并作具体部件执行上述实施例提供的任意一项所述的语音控制方法。
其中,处理器601内部设置有微存储器,用于存储程序,程序可以包括程序代码,程序代码包括计算机操作指令。微存储器可能包含随机存取存储器(random access memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。微存储器可以为一个,当然,微存储器也可以根据需要,为多个微存理器。微处理器,用于读取微存储器中存储的程序代码。微存储器用于临时存储语音控制程序,当启动语音控制后,存储器中的语音控制程序随即释放。
基于本申请实施例提供的语音控制装置,本申请实施例还提供了一种手机,所述手机包括语音控制装置,所述语音控制装置为上述实施例所述的语音控制装置。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处,相关之处参见方法实施例的部分说明即可。本领域技术人员在考虑说明书及实践这里的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种语音控制方法,其特征在于,所述方法包括:
获取包含控制指令的语音,解析所述语音中包含的控制指令;
根据所述控制指令,获取与所述控制指令相匹配控件的预置识别码;
获取终端当前操作界面的屏幕信息,根据所述预置识别码查找所述屏幕信息;
判断是否从所述屏幕信息中找到与所述预置识别码相同的控件;
若从所述屏幕信息中找到与所述预置识别码相同的控件,则模拟点击所述控件;
若未能从所述屏幕信息中找到与所述预置识别码相同的控件,则获取用户手动操作过程中所点击控件的识别码,根据所述用户操作过程中所点击控件的识别码更新所述预置识别码;
从本地智能语音数据库中更新后控件的识别码,根据更新后的控件的识别码从当前操作界面的屏幕信息找到与所述预置识别码相同的控件,进行控件模拟点击。
2.根据权利要求1所述的语音控制方法,其特征在于,所述预置识别码为预置text或预置ID。
3.根据权利要求1所述的语音控制方法,其特征在于,所述获取终端当前操作界面的屏幕信息,包括:
基于辅助功能获取终端当前操作界面的屏幕信息。
4.根据权利要求1所述的语音控制方法,其特征在于,在所述根据所述控制指令,获取与所述控制指令相匹配控件的预置识别码前,所述方法还包括:
匹配解析出的控制指令和预置词条,判断解析出的控制指令是否符合预置词条;
当解析出的控制指令符合预置词条时,根据所述预置词条拆分解析出的控制指令,获得若干相应控制指令。
5.根据权利要求1所述的语音控制方法,其特征在于,所述获取用户手动操作过程中所点击控件的识别码,包括:
提示用户手动操作,根据所述用户手动操作获取用户手动操作过程中所点击控件的识别码。
6.根据权利要求1所述的语音控制方法,其特征在于,所述根据所述用户操作过程中所点击控件的识别码更新所述预置识别码,包括:
提醒用户是否更新所述预置识别码;
当接收到更新所述预置识别码的信号时,获取用户操作过程中所点击控件的识别码,根据所述用户操作过程中所点击控件的识别码更新所述预置识别码。
7.根据权利要求1所述的语音控制方法,其特征在于,所述根据所述预置识别码查找所述屏幕信息,判断是否从所述屏幕信息中找到与所述预置识别码相同的控件,包括:
根据所述预置识别码查找所述屏幕信息,并返回查找列表,判断返回的查找列表是否为空。
8.根据权利要求1所述的语音控制方法,其特征在于,所述获取用户手动操作过程中所点击控件的识别码,包括:
基于窗口管理服务获取用户手动操作过程中所点击控件的识别码。
9.一种语音控制装置,其特征在于,所述控制装置包括处理器和存储器;
所述存储器,用于存储程序代码;
所述处理器,用于读取所述存储器中存储的程序代码,并作为具体部件执行上述权利要求1-8中任意一项所述的语音控制方法。
10.一种手机,其特征在于,所述手机包括语音控制装置,所述语音控制装置如上述权利要求9所述的语音控制装置。
CN201810569218.7A 2018-06-05 2018-06-05 一种语音控制方法、装置及手机 Active CN110570846B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810569218.7A CN110570846B (zh) 2018-06-05 2018-06-05 一种语音控制方法、装置及手机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810569218.7A CN110570846B (zh) 2018-06-05 2018-06-05 一种语音控制方法、装置及手机

Publications (2)

Publication Number Publication Date
CN110570846A CN110570846A (zh) 2019-12-13
CN110570846B true CN110570846B (zh) 2022-04-22

Family

ID=68772198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810569218.7A Active CN110570846B (zh) 2018-06-05 2018-06-05 一种语音控制方法、装置及手机

Country Status (1)

Country Link
CN (1) CN110570846B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111475241B (zh) * 2020-04-02 2022-03-11 深圳创维-Rgb电子有限公司 一种界面的操作方法、装置、电子设备及可读存储介质
CN112017656A (zh) * 2020-08-11 2020-12-01 博泰车联网(南京)有限公司 一种语音控制方法、装置及计算机存储介质
CN113539255A (zh) * 2021-06-03 2021-10-22 深圳市艾特智能科技有限公司 离线语音控制方法、***、可读存储介质及计算机设备
CN115328347B (zh) * 2022-08-09 2024-06-04 青岛海信移动通信技术有限公司 界面展示方法、装置、终端设备和存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040230637A1 (en) * 2003-04-29 2004-11-18 Microsoft Corporation Application controls for speech enabled recognition
US20120110456A1 (en) * 2010-11-01 2012-05-03 Microsoft Corporation Integrated voice command modal user interface
CN103869931B (zh) * 2012-12-10 2017-02-08 三星电子(中国)研发中心 语音控制用户界面的方法及装置
CN104102704B (zh) * 2014-07-08 2017-12-26 深信服科技股份有限公司 ***控件展示方法和装置
CN105161106A (zh) * 2015-08-20 2015-12-16 深圳Tcl数字技术有限公司 智能终端的语音控制方法、装置及电视机***
CN105791931A (zh) * 2016-02-26 2016-07-20 深圳Tcl数字技术有限公司 智能电视及其语音控制方法
CN106098061B (zh) * 2016-06-01 2020-07-03 Tcl科技集团股份有限公司 一种基于安卓***的语音交互方法和装置
CN106373570A (zh) * 2016-09-12 2017-02-01 深圳市金立通信设备有限公司 一种语音控制方法及终端
CN109147776A (zh) * 2017-06-19 2019-01-04 丽宝大数据股份有限公司 具有声控功能的显示装置及声控时机指示方法
CN109471678A (zh) * 2018-11-07 2019-03-15 苏州思必驰信息科技有限公司 基于图像识别的语音中控方法及装置

Also Published As

Publication number Publication date
CN110570846A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
CN110570846B (zh) 一种语音控制方法、装置及手机
US10496382B2 (en) Machine generation of context-free grammar for intent deduction
EP3616194B1 (en) Voice user interface shortcuts for an assistant application
CN108279931B (zh) 场境粘贴目标预测
KR102189855B1 (ko) 다이얼로그 시스템들에서의 파라미터 수집 및 자동 다이얼로그 생성
CN110046227B (zh) 对话***的配置方法、交互方法、装置、设备和存储介质
EP1866750B1 (en) Methods and apparatus for providing on-demand assistance for a wireless device
CN110691160A (zh) 一种语音控制方法、装置及手机
US11749278B2 (en) Recommending automated assistant action for inclusion in automated assistant routine
KR20180058476A (ko) 다양한 입력 처리를 위한 방법, 이를 위한 전자 장치 및 서버
CN111753064B (zh) 一种人机交互方法及其装置
CN111292744B (zh) 语音指令识别方法、***及计算机可读存储介质
KR102307380B1 (ko) 자연어 처리 기반 콜센터 지원 시스템 및 방법
EP3608772A1 (en) Method for executing function based on voice and electronic device supporting the same
CN116521841B (zh) 用于生成回复信息的方法、装置、设备及介质
CN112286486B (zh) 智能终端上应用程序的运行方法、智能终端和存储介质
CN113938733A (zh) 遥控设备快捷键控制方法、设备、存储介质及装置
CN116841506B (zh) 程序代码生成方法及装置、模型训练方法及装置
CN107977127B (zh) 更新页面的方法、装置及终端
CN110136700B (zh) 一种语音信息处理方法及装置
CN112199470A (zh) 一种基于会话的客诉服务方法、智能终端及存储介质
WO2020024436A1 (zh) 一种用户信息的更新方法、***和服务器
CN113360590B (zh) 兴趣点信息的更新方法、装置、电子设备及存储介质
CN106708558B (zh) 关闭应用程序的方法和装置
CN112581957B (zh) 一种计算机语音控制方法、***及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 266071 Shandong city of Qingdao province Jiangxi City Road No. 11

Patentee after: Qingdao Hisense Mobile Communication Technology Co.,Ltd.

Address before: 266071 Shandong city of Qingdao province Jiangxi City Road No. 11

Patentee before: HISENSE MOBILE COMMUNICATIONS TECHNOLOGY Co.,Ltd.