CN108153574B - 应用程序处理方法、装置及电子设备 - Google Patents

应用程序处理方法、装置及电子设备 Download PDF

Info

Publication number
CN108153574B
CN108153574B CN201711463987.0A CN201711463987A CN108153574B CN 108153574 B CN108153574 B CN 108153574B CN 201711463987 A CN201711463987 A CN 201711463987A CN 108153574 B CN108153574 B CN 108153574B
Authority
CN
China
Prior art keywords
operation control
control node
application program
page
traversal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711463987.0A
Other languages
English (en)
Other versions
CN108153574A (zh
Inventor
林德康
邬霄云
赵海
毛景树
陈灏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qidian Intelligent Technology Co ltd
Original Assignee
Beijing Qidian Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qidian Intelligent Technology Co ltd filed Critical Beijing Qidian Intelligent Technology Co ltd
Priority to CN201711463987.0A priority Critical patent/CN108153574B/zh
Publication of CN108153574A publication Critical patent/CN108153574A/zh
Application granted granted Critical
Publication of CN108153574B publication Critical patent/CN108153574B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供一种应用程序处理方法、装置及电子设备,该方法包括:插件接收第一用户输入的语音,并对输入语音进行识别以得到此语音的含义。再根据此语音含义从已经生成的、与此应用程序对应的多条操作路径中,确定与语音含义相匹配的目标操作路径,其中,已经生成的操作路径是由操作控件节点序列组成的。插件向应用程序发送执行指令,应用程序响应于执行指令依次执行目标操作路径中的各个操作控件节点,从而实现与第一用户输入的语音相对应的功能。通过语音控制便可以使应用程序实现相应的功能,也即是为应用程序提供了一种全新的语音操作模式,省去了在实现此功能过程中所需的多次点击操作,简便了操作的同时也提高了用户的使用黏性。

Description

应用程序处理方法、装置及电子设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种应用程序处理方法、装置及电子设备。
背景技术
智能手机可以通过下载应用程序来拓展手机的功能。近几年,随着智能手机的发展,各大软件公司争先开发用于满足用户不同方面需求的应用程序,并且各个应用程序中提供的功能也越来越丰富。
但在用户实际使用应用程序时,为了实现某一功能,用户往往需要多次点击相应的功能按钮,经过层层界面,最终才能进入该功能对应的页面。这样使用户的操作过程变得十分复杂。同时,对于智能手机使用不熟练的用户,这种复杂的操作过程也会大大降低他们对应用程序的使用粘性。
发明内容
有鉴于此,本发明实施例提供一种应用程序处理方法、装置及电子设备,用以简便用户的操作,提高用户的使用粘性。
本发明实施例提供一种应用程序处理方法,包括:
接收第一用户的输入语音;
从与应用程序对应的已生成的操作路径中,根据所述操作路径各自对应的功能标签与所述输入语音的匹配性,确定与所述输入语音对应的目标操作路径,所述目标操作路径由操作控件节点序列组成;
向所述应用程序发送执行指令,以使所述应用程序依次执行所述目标操作路径中的各操作控件节点。
可选地,所述向所述应用程序发送执行指令,以使所述应用程序依次执行所述目标操作路径中的各操作控件节点,包括:
结合所述应用程序对应的预设页面结构元素数据库,识别所述应用程序的当前页面中包含的页面结构元素;
根据所述目标操作路径中各操作控件节点分别对应的页面结构元素,从所述各操作控件节点中确定起始操作控件节点,其中,所述起始操作控件节点对应的页面结构元素与所述当前页面中包含的页面结构元素相同;
向所述应用程序发送执行指令,以使所述应用程序从所述起始操作控件节点开始依次执行所述目标操作路径中的剩余操作控件节点。
可选地,所述方法还包括:
获取所述应用程序对应的操作控件节点树;
逐次从所述操作控件节点树的根节点开始遍历所述操作控件节点树,以在当前遍历到的操作控件节点满足截止条件时生成与此次遍历对应的操作路径;
其中,所述截止条件包括:当前遍历到的操作控件节点为叶子节点,或者,当前遍历到的操作控件节点所对应的页面结构元素与此次遍历之前已经遍历到的操作控件节点所对应的页面结构元素相同。
可选地,所述方法还包括:
在所述此次遍历的过程中,对于遍历到的任一操作控件节点,获取操作所述任一操作控件节点后显示的页面中所包含的页面元素与所述预设页面结构元素数据库中包含的页面结构元素之间的交集作为所述任一操作控件节点对应的页面结构元素。
可选地,所述生成与此次遍历对应的操作路径之后,还包括:
按照所述此次遍历对应的操作路径中各操作控件节点的遍历顺序,展示所述各操作控件节点对应的页面;
接收第二用户根据展示出的页面输入的与所述此次遍历对应的操作路径相对应的功能标签;
关联存储所述此次遍历对应的操作路径与所述功能标签。
本发明实施例提供一种应用程序处理装置,包括:
接收模块,用于接收第一用户的输入语音;
路径确定模块,用于从与应用程序对应的已生成的操作路径中,根据所述操作路径各自对应的功能标签与所述输入语音的匹配性,确定与所述输入语音对应的目标操作路径,所述目标操作路径由操作控件节点序列组成;
发送模块,用于向所述应用程序发送执行指令,以使所述应用程序依次执行所述目标操作路径中的各操作控件节点。
可选地,所述发送模块具体包括:
识别单元,用于结合所述应用程序对应的预设页面结构元素数据库,识别所述应用程序的当前页面中包含的页面结构元素;
节点确定单元,用于根据所述目标操作路径中各操作控件节点分别对应的页面结构元素,从所述各操作控件节点中确定起始操作控件节点,其中,所述起始操作控件节点对应的页面结构元素与所述当前页面中包含的页面结构元素相同;
发送单元,用于向所述应用程序发送执行指令,以使所述应用程序从所述起始操作控件节点开始依次执行所述目标操作路径中的剩余操作控件节点。
可选地,所述装置还包括:
节点获取模块,用于获取所述应用程序对应的操作控件节点树;
生成模块,用于逐次从所述操作控件节点树的根节点开始遍历所述操作控件节点树,以在当前遍历到的操作控件节点满足截止条件时生成与此次遍历对应的操作路径;
其中,所述截止条件包括:当前遍历到的操作控件节点为叶子节点,或者,当前遍历到的操作控件节点所对应的页面结构元素与此次遍历之前已经遍历到的操作控件节点所对应的页面结构元素相同。
可选地,所述装置还包括:
展示模块,用于按照所述此次遍历对应的操作路径中各操作控件节点的遍历顺序,展示所述各操作控件节点对应的页面;
接收模块,用于接收第二用户根据展示出的页面输入的与所述此次遍历对应的操作路径相对应的功能标签;
存储模块,用于关联存储所述此次遍历对应的操作路径与所述功能标签。
本发明实施例提供一种电子设备,包括:处理器,以及与所述处理器连接的存储器;
所述存储器,用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理器调用执行;
所述处理器,用于执行所述一条或多条计算机指令以上述应用程序处理方法中的任意一种方法。
本发明实施例提供的应用程序处理方法、装置及电子设备,终端设备上同时安装有插件和应用程序。首先,插件接收第一用户输入的语音,并对输入语音进行识别以得到此语音的含义。然后,再根据此语音含义从已经生成的、与此应用程序对应的多条操作路径中,确定与语音含义相匹配的目标操作路径,此匹配可以表现为:目标操作路径的功能标签与语音含义相同或相近,其中,已经生成的操作路径是由操作控件节点序列组成的。插件向应用程序发送执行指令,应用程序响应于执行指令依次执行目标操作路径中的各个操作控件节点,从而实现与第一用户输入的语音相对应的功能。通过语音控制便可以使应用程序实现相应的功能,也即是为应用程序提供了一种全新的语音操作模式,省去了在实现此功能过程中所需的多次点击操作,简便了操作的同时也提高了用户的使用黏性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的应用程序处理方法实施例一的流程图;
图2为本发明实施例提供的应用程序处理方法实施例二的流程图;
图3为本发明实施例提供的应用程序处理方法实施例三的流程图;
图4为本发明实施例提供的应用程序处理装置实施例一的结构示意图;
图5为本发明实施例提供的应用程序处理装置实施例二的结构示意图;
图6为本发明实施例提供的应用程序处理装置实施例三的结构示意图;
图7为本发明实施例提供的电子设备实施例一的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述XXX,但这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者***中还存在另外的相同要素。
图1为本发明实施例提供的应用程序处理方法实施例一的流程图,本实施例提供的该应用程序处理方法的执行主体可以为安装于终端设备上的插件,如图1所示,该方法包括如下步骤:
S101,接收第一用户的输入语音。
S102,从与应用程序对应的已生成的操作路径中,根据操作路径各自对应的功能标签与输入语音的匹配性,确定与输入语音对应的目标操作路径,目标操作路径由操作控件节点序列组成。
第一用户打开安装于终端设备上的某一应用程序后,若想实现此应用程序中提供的某一功能,如支付、聊天等等,此时,第一用户可以向终端设备输入语音。同样安装于终端设备上的插件可以接收用户的输入语音,并通过内置的语音识别算法识别出此输入语音的含义。其中,可选地,第一用户可以是终端设备的使用者,在实际应用中,此使用者既可以是普通用户也可以是安装于终端设备上的插件的开发者。可选地,内置的语音识别算法可以是基于神经网络模型的深度学习算法、基于隐马尔科夫模型(Hidden Markov Model,HMM)的语音识别算法等等。
插件再根据识别出的语音含义从与该应用程序对应的已生成的操作路径中确定出一条目标操作路径,其中,此目标操作路径的功能标签与识别出的语音含义具有匹配性,此匹配性可以表现为目标操作路径的功能标签与识别出的语音含义具有相同或相近的含义。确定功能标签与语音含义之间的匹配性也可以理解为确定二者之间的相似度,可选地,可以基于语料库或者语义词典计算二者的相似度。当二者相似度大于预设数值时,则表示功能标签与语音含义具有匹配性。其中,无论是确定出的目标操作路径还是已生成的操作路径中的其他路径都是由操作控件节点序列组成的。可选地,组成操作路径的操作控件节点序列可以理解在要实现应用程序中某一功能的过程中所触发的控件的顺序。其中,控件可以为页面中提供的可交互按钮,第一用户通过点击可交互按钮即可实现某一功能。在实际应用中,以支付应用程序举例来说,可交互按钮可以是位于页面下部的“首页”、“口碑”、“朋友”、“我”等按钮。
可选地,上述描述中涉及的“已生成的操作路径”的具体生成过程以及“操作路径对应的功能标签”的具体设置过程都可以参见下述实施例三中的相关描述,在此不再详细展开。
S103,向应用程序发送执行指令,以使应用程序依次执行目标操作路径中的各操作控件节点。
在确定出目标操作路径后,插件向该应用程序发送执行指令,可选地,此执行指令中包括组成目标操作路径的操作控件节点序列。应用程序根据接收到的控制指令,依次执行各个操作控件节点。每执行一个操作控制节点都相当于第一用户点击了页面中的一个控件。当目标操作路径中的各个操作控件节点全部执行完成后,终端设备当前显示的应用程序的页面即为与第一用户输入语音的语音含义对应的页面,以实现利用插件对应用程序进行语音控制。
需要说明的是,上述以及下述实施例可以理解为:给安装于终端设备上的应用程序提供了一种利用插件对应用程序进行语音控制的方法。可选地,插件可以对终端设备上的所有应用程序进行语音控制,也可以仅对终端设备上的部分应用程序进行语音控制。当插件对部分应用程序进行语音控制时,第一用户可以根据终端设备***内提供的相关功能,例如辅助功能,人为选择出需要利用插件进行语音控制的那部分应用程序。具体来说,终端设备需要先开启***中提供的相关功能,然后,第一用户便可以根据自身需求从终点设备的应用程序列表中选择想要实现语音控制的应用程序。
本实施例中,安装于终端设备上的插件接收第一用户输入的语音,并对输入语音进行识别以得到此语音的含义。然后,再根据此语音含义从已经生成的、与此应用程序对应的多条操作路径中,确定与语音含义相匹配的目标操作路径,此匹配可以表现为:目标操作路径的功能标签与语音含义相同或相近,其中,已经生成的操作路径是由操作控件节点序列组成的。插件向应用程序发送执行指令,应用程序响应于执行指令依次执行目标操作路径中的各个操作控件节点,从而实现与第一用户输入的语音相对应的功能。通过语音控制便可以使应用程序实现相应的功能,也即是为应用程序提供了一种全新的语音操作模式,省去了在实现此功能过程中所需的多次点击操作,简便了操作的同时也提高了用户的使用黏性。
已生成的所有操作路径的起点都对应于应用程序的首页,上述实施例一中,并没有限定在第一用户输入语音时,应用程序的当前页面是首页还是非首页。而在实际应用中,很有可能会出现:在应用程序当前页面是非首页时第一用户输入语音的情况。此时,若应用程序依旧依次执行目标操作路径中的各操作控件节点的话,就会出现应用程序需要首先从当前的非首页页面先退回到首页页面,再从首页页面按照目标操作路径层层进入,以到达最终的目标页面。这样就会出现某些页面重复出现,降低了到达目标页面的速度。
为了避免上述问题的出现,图2为本发明实施例提供的应用程序处理方法实施例二的流程图,如图2所示,该方法包括如下步骤:
S201,接收第一用户的输入语音。
S202,从与应用程序对应的已生成的操作路径中,根据操作路径各自对应的功能标签与输入语音的匹配性,确定与输入语音对应的目标操作路径,目标操作路径由操作控件节点序列组成。
上述步骤S201-S202执行过程与前述实施例的相应步骤相似,可以参见如图1所示实施例中的相关描述,在此再不赘述。
S203,结合应用程序对应的预设页面结构元素数据库,识别应用程序的当前页面中包含的页面结构元素。
插件可以通过终端设备提供的相应功能,例如实施例一中涉及的辅助功能,实时获取应用程序当前页面中包含的页面元素。获取到的页面元素中可以同时包括页面数据元素以及页面结构元素。其中,页面结构元素为在应用程序开发完成后应用程序就存在的原始元素,页面数据元素为随着第一用户的使用不断新增的元素。
在插件通过终端设备提供的相应功能获取当前页面中包含的页面元素后,可选地,由于获取的页面结构元素和页面数据元素可以是存储于一个数据包中的,因此,可选地,插件可以通过以下方式从页面元素中识别出页面结构元素:
对应用程序对应的预设页面结构元素数据库以及获取到的当前页面的页面元素取交集,交集中包含的元素即为应用程序当前页面中包含的页面结构元素。
其中,以聊天应用程序的首页为例,在第一用户首次登陆此聊天应用程序时,首页中存在的具有交互功能的固定控件,例如首页下方提供的“首页”、“通讯录”、“发现”以及“我”等固定控件,以及首页中出现的其他不具有交互功能的文字字段,例如位于首页顶端中央位置的“首页”字段,这些原始元素均可以认为是页面结构元素。
随着此聊天应用程序被第一用户不断使用,此聊天应用程序的首页中会逐渐新增与通讯录中的某联系人的聊天框、聊天内容以及应用程序根据第一用户的喜好自动推送的推送内容,这些不是本来就存在于首页中的新增元素可以认为是页面数据元素。
其中,上述描述中涉及的与应用程序对应的预设页面结构元素数据库可以是在此应用程序安装完成后,插件便可直接获取到的。可选地,此预设页面结构元素数据库可以为此应用程序对应的源文件,并且此源文件是在应用程序开发完成后即可产生的文件。其中,可选地,此预设页面结构元素数据库中包含有此应用程序所有页面中包含的页面结构元素,并且每个页面的页面结构元素具体可以为页面中包含的具有交互功能的控件、控件所在位置、页面中各种不具有交互功能的文字字段以及文字字段所在位置等等。
S204,根据目标操作路径中各操作控件节点分别对应的页面结构元素,从各操作控件节点中确定起始操作控件节点,其中,起始操作控件节点对应的页面结构元素与当前页面中包含的页面结构元素相同。
S205,向应用程序发送执行指令,以使应用程序从起始操作控件节点开始依次执行目标操作路径中的剩余操作控件节点。
在确定出当前页面中包含的页面结构元素后,可选地,插件可以利用预先建立的页面结构元素与操作控件节点之间的关联关系确定当前页面中包含的页面结构元素与目标操作路径中的那个操作控件节点相对应,并将确定出的操作控件节点作为起始操作控件节点。可选地,页面结构元素与操作控件节点之间的关联关系的建立可以过程可以参见下述实施例三中的相关描述。
然后,插件可以向应用程序发送执行指令,此执行指令中包括此起始操作控件节点。此时应用程序在接收到执行指令后,从此起始操作控件节点开始,依次执行目标操作路径中的剩余操作控件节点。
需要说明的是,上述以及下述实施例中涉及的应用程序是允许插件对其进行语音控制的应用程序。而终端设备中哪些应用程序是允许插件对其进行语音控制的,可以参考实施例一中最后部分的相关描述,在此不再赘述。
本实施例中,插件在根据接收到第一用户的输入语音确定出目标操作路径后,插件通过终端设备中提供的相关功能可以获得当前页面的页面元素,结合此应用程序对应的预设页面结构元素数据库以及当前页面的页面元素识别出当前页面中包含的页面结构元素。再根据页面结构元素与操作控件节点之间预设的关联关系确定出与当前页面的页面结构元素关联的操作控件节点即起始操作控件节点。最后,插件将包含起始操作控件节点的执行指令发送至应用程序,应用程序可以从起始操作控件节点开始依次执行目标操作路径中剩余的操作控件节点。当应用程序的当前页面是非首页页面时,则应用程序会从当前页面的页面结构元素对应的操作控件节点开始执行执行指令,在到达最终的目标页面的过程中不会出现页面回退再进入的情况,提高了到达目标页面的速度。
上述各实施例都是在已经生成了操作路径,并且操作路径中的各个操作控件节点都存在对应的页面结构元素的基础上进行的,基于此,图3为本发明实施例提供的应用程序处理方法实施例三的流程图,如图3所示,该方法包括如下步骤:
S301,获取应用程序对应的操作控件节点树。
S302,逐次从操作控件节点树的根节点开始遍历操作控件节点树,以在当前遍历到的操作控件节点满足截止条件时生成与此次遍历对应的操作路径。
根据上述实施例中相关描述,插件可以通过终端设备提供的相应功能,例如辅助功能,获得应用程序中各个页面中存在的控件。同时在获取到各个页面中存在的控件后,插件还可以根据获取到的控件进一步得到与此应用程序对应的、由各个控件组成操作控件节点树。
插件从操作控件节点树的根节点开始遍历操作控件节点树中的各个操作控件节点,再结合遍历截止条件生成操作路径。
具体地,当前遍历到的操作控件节点为叶子节点,也即是前遍历到的操作控件节点没有对应的下一级操作控件节点。此时,插件可以停止此次操作控件节点的遍历,可以由此叶子节点以及之前遍历过的操作控件节点按照遍历的先后顺序组成此次遍历对应的一条操作路径。
当前遍历到的操作控件节点所对应的页面结构元素与此次遍历之前已经遍历到的操作控件节点所对应的页面结构元素相同,则表明页面结构元素在之前的遍历过程中已经重复出现过,如果继续遍历则会出现不断循环的状态。此时,插件可以停止此次操作控件节点的遍历,将当前遍历到的操作控件节点与之前遍历过的操作控件节点按照遍历的先后顺序组成此次遍历对应的一条操作路径。
在对操作控件节点树中的操作控件节点全部遍历后,即可生成与应用程序对应的操作路径。
生成操作路径后,可选地,插件还可以通过以下方式建立操作控件节点与页面元素之间的关联关系。
在每一次遍历的过程中,在遍历到的任一操作控件节点后,插件可以获取操作某一操作控件节点A后显示的页面中所包含的页面元素,页面元素中包括页面结构元素与页面数据元素,与实施例二中“识别应用程序的当前页面中包含的页面结构元素”相类似的,插件可以对显示的页面中包含的页面元素与预设页面结构元素数据库中包含的页面结构元素做交集,并将交集中包含的元素作为此操作控件节点A对应的页面结构元素,此时插件也即是建立了操作控件节点A与页面结构元素之间的关联关系。
另外,根据上述实施例提供的应用程序处理方法,在根据用户的输入语音进行目标操作路径的确认工程中,需要利用到操作路径对应的功能标签,因此,可选地,该应用程序处理方法还可以包括以下步骤:
S303,按照此次遍历对应的操作路径中各操作控件节点的遍历顺序,展示各操作控件节点对应的页面。
S304,接收第二用户根据展示出的页面输入的与此次遍历对应的操作路径相对应的功能标签。
S305,关联存储此次遍历对应的操作路径与功能标签。
在每生成一条操作路径后,插件可以利用终端设备提供的相关功能,例如辅助功能,获取与操作路径中各操作控件节点分别对应页面元素,并根据页面元素分别生成与各操作控件节点对应页面。插件再通过终端设备的屏幕,将各操作控件节点分别对应的页面按照此操作路径中各操作控件节点的顺序依次展示出来。第二用户通过页面的依次展示即可知晓此操作路径所实现的功能。可选地,第二用户通常为插件的开发人员。第二用户可以根据操作路径实现的功能向终端设备的屏幕输入与此操作路径对应的功能标签。最终,插件再存储操作路径与功能标签之间的关联关系。
本实施例中,插件可以根据终端设备提供的相应功能获取应用程序对应的操作控件节点树。通过依次遍历的方式,结合遍历截止条件生成与此应用程序对应的操作路径。同时,插件可以建立操作路径中各操作控件节点与页面结构元素之间的关联关系。进一步地,插件再通过依次显示操作路径中操作控件节点对应的页面,使第二用户对操作路径设置对应的功能标签,并将操作路径与功能标签之间的关联关系进行存储。这样可以使插件根据第一用户的输入语音以及第二用户设置的操作路径的功能标签确定出一条目标操作路径。当第一用户输入语音时,插件可以根据目标操作路径实现对应用程序的语音控制,从而简化用户的操作。
图4为本发明实施例提供的应用程序处理装置实施例一的结构示意图,如图4所示,该应用程序处理装置包括:接收模块11、路径确定模块12和发送模块13。
接收模块11,用于接收第一用户的输入语音。
路径确定模块12,用于从与应用程序对应的已生成的操作路径中,根据操作路径各自对应的功能标签与输入语音的匹配性,确定与输入语音对应的目标操作路径,目标操作路径由操作控件节点序列组成。
发送模块13,用于向应用程序发送执行指令,以使应用程序依次执行目标操作路径中的各操作控件节点。
图4所示装置可以执行图1所示实施例的方法,本实施例未详细描述的部分,可参考对图1所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1所示实施例中的描述,在此不再赘述。
图5为本发明实施例提供的应用程序处理装置实施例二的结构示意图,如图5所示,在图4所示实施例基础上,该应用程序处理装置中的发送模块13具体包括:
识别单元131,用于结合应用程序对应的预设页面结构元素数据库,识别应用程序的当前页面中包含的页面结构元素。
节点确定单元132,用于根据目标操作路径中各操作控件节点分别对应的页面结构元素,从各操作控件节点中确定起始操作控件节点,其中,起始操作控件节点对应的页面结构元素与当前页面中包含的页面结构元素相同。
发送单元133,用于向应用程序发送执行指令,以使应用程序从起始操作控件节点开始依次执行目标操作路径中的剩余操作控件节点。
图5所示装置可以执行图2所示实施例的方法,本实施例未详细描述的部分,可参考对图2所示实施例的相关说明。该技术方案的执行过程和技术效果参见图2所示实施例中的描述,在此不再赘述。
图6为本发明实施例提供的应用程序处理装置实施例三的结构示意图,如图6所示,在图5所示实施例基础上,该应用程序处理装置还包括:第一获取模块21和生成模块22。
节点获取模块21,用于获取应用程序对应的操作控件节点树。
生成模块22,用于逐次从操作控件节点树的根节点开始遍历操作控件节点树,以在当前遍历到的操作控件节点满足截止条件时生成与此次遍历对应的操作路径,其中,截止条件包括:当前遍历到的操作控件节点为叶子节点,或者,当前遍历到的操作控件节点所对应的页面结构元素与此次遍历之前已经遍历到的操作控件节点所对应的页面结构元素相同。
可选地,该应用程序处理装置还包括:第二获取模块23。
元素获取模块23,用于在此次遍历的过程中,对于遍历到的任一操作控件节点,获取操作任一操作控件节点后显示的页面中所包含的页面元素与预设页面结构元素数据库中包含的页面结构元素之间的交集作为任一操作控件节点对应的页面结构元素。
可选地,该应用程序处理装置还包括:展示模块24、接收模块25和存储模块26。
展示模块24,用于按照此次遍历对应的操作路径中各操作控件节点的遍历顺序,展示各操作控件节点对应的页面。
接收模块25,用于接收第二用户根据展示出的页面输入的与此次遍历对应的操作路径相对应的功能标签。
存储模块26,用于关联存储此次遍历对应的操作路径与功能标签。
图6所示装置可以执行图3所示实施例的方法,本实施例未详细描述的部分,可参考对图3所示实施例的相关说明。该技术方案的执行过程和技术效果参见图3所示实施例中的描述,在此不再赘述。
以上描述了应用程序处理装置的内部功能和结构,在一个可能的设计中,应用程序处理装置的结构可实现为一电子设备。图7为本发明实施例提供的电子设备实施例一的结构示意图,如图7所示,该电子设备包括:处理器31,以及与处理器连接的存储器32。存储器32用于存储电子设备执行上述任一实施例中提供的应用程序处理方法的程序。处理器31被配置为用于执行存储器32中存储的程序,程序包括一条或多条计算机指令,其中,一条或多条计算机指令被处理器31执行时能够实现如下步骤:
接收第一用户的输入语音;
从与应用程序对应的已生成的操作路径中,根据操作路径各自对应的功能标签与输入语音的匹配性,确定与输入语音对应的目标操作路径,目标操作路径由操作控件节点序列组成;
向应用程序发送执行指令,以使应用程序依次执行目标操作路径中的各操作控件节点。
可选地,处理器31还用于执行前述各方法步骤中的全部或部分步骤。
其中,电子设备的结构中还可以包括通信接口33,用于电子设备与其他设备或通信网络通信。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以产品的形式体现出来,该计算机产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种应用程序处理方法,其特征在于,包括:
接收第一用户的输入语音;
从与应用程序对应的已生成的操作路径中,根据所述操作路径各自对应的功能标签与所述输入语音的匹配性,确定与所述输入语音对应的目标操作路径,所述目标操作路径由操作控件节点序列组成;
向所述应用程序发送执行指令,以使所述应用程序依次执行所述目标操作路径中的各操作控件节点;
所述向所述应用程序发送执行指令,以使所述应用程序依次执行所述目标操作路径中的各操作控件节点,包括:
结合所述应用程序对应的预设页面结构元素数据库,识别所述应用程序的当前页面中包含的页面结构元素;
根据所述目标操作路径中各操作控件节点分别对应的页面结构元素,从所述各操作控件节点中确定起始操作控件节点,其中,所述起始操作控件节点对应的页面结构元素与所述当前页面中包含的页面结构元素相同;
向所述应用程序发送执行指令,以使所述应用程序从所述起始操作控件节点开始依次执行所述目标操作路径中的剩余操作控件节点。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述应用程序对应的操作控件节点树;
逐次从所述操作控件节点树的根节点开始遍历所述操作控件节点树,以在当前遍历到的操作控件节点满足截止条件时生成与此次遍历对应的操作路径;
其中,所述截止条件包括:当前遍历到的操作控件节点为叶子节点,或者,当前遍历到的操作控件节点所对应的页面结构元素与此次遍历之前已经遍历到的操作控件节点所对应的页面结构元素相同。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在所述此次遍历的过程中,对于遍历到的任一操作控件节点,获取操作所述任一操作控件节点后显示的页面中所包含的页面元素与所述预设页面结构元素数据库中包含的页面结构元素之间的交集作为所述任一操作控件节点对应的页面结构元素。
4.根据权利要求2所述的方法,其特征在于,所述生成与此次遍历对应的操作路径之后,还包括:
按照所述此次遍历对应的操作路径中各操作控件节点的遍历顺序,展示所述各操作控件节点对应的页面;
接收第二用户根据展示出的页面输入的与所述此次遍历对应的操作路径相对应的功能标签;
关联存储所述此次遍历对应的操作路径与所述功能标签。
5.一种应用程序处理装置,其特征在于,包括:
接收模块,用于接收第一用户的输入语音;
路径确定模块,用于从与应用程序对应的已生成的操作路径中,根据所述操作路径各自对应的功能标签与所述输入语音的匹配性,确定与所述输入语音对应的目标操作路径,所述目标操作路径由操作控件节点序列组成;
发送模块,用于向所述应用程序发送执行指令,以使所述应用程序依次执行所述目标操作路径中的各操作控件节点;
所述发送模块具体包括:
识别单元,用于结合所述应用程序对应的预设页面结构元素数据库,识别所述应用程序的当前页面中包含的页面结构元素;
节点确定单元,用于根据所述目标操作路径中各操作控件节点分别对应的页面结构元素,从所述各操作控件节点中确定起始操作控件节点,其中,所述起始操作控件节点对应的页面结构元素与所述当前页面中包含的页面结构元素相同;
发送单元,用于向所述应用程序发送执行指令,以使所述应用程序从所述起始操作控件节点开始依次执行所述目标操作路径中的剩余操作控件节点。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
节点获取模块,用于获取所述应用程序对应的操作控件节点树;
生成模块,用于逐次从所述操作控件节点树的根节点开始遍历所述操作控件节点树,以在当前遍历到的操作控件节点满足截止条件时生成与此次遍历对应的操作路径;
其中,所述截止条件包括:当前遍历到的操作控件节点为叶子节点,或者,当前遍历到的操作控件节点所对应的页面结构元素与此次遍历之前已经遍历到的操作控件节点所对应的页面结构元素相同。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
展示模块,用于按照所述此次遍历对应的操作路径中各操作控件节点的遍历顺序,展示所述各操作控件节点对应的页面;
接收模块,用于接收第二用户根据展示出的页面输入的与所述此次遍历对应的操作路径相对应的功能标签;
存储模块,用于关联存储所述此次遍历对应的操作路径与所述功能标签。
8.一种电子设备,其特征在于,包括:处理器,以及与所述处理器连接的存储器;
所述存储器,用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理器调用执行;
所述处理器,用于执行所述一条或多条计算机指令以实现权利要求1至4中任一项所述的方法。
CN201711463987.0A 2017-12-28 2017-12-28 应用程序处理方法、装置及电子设备 Active CN108153574B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711463987.0A CN108153574B (zh) 2017-12-28 2017-12-28 应用程序处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711463987.0A CN108153574B (zh) 2017-12-28 2017-12-28 应用程序处理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN108153574A CN108153574A (zh) 2018-06-12
CN108153574B true CN108153574B (zh) 2021-05-28

Family

ID=62462541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711463987.0A Active CN108153574B (zh) 2017-12-28 2017-12-28 应用程序处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN108153574B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641280A (zh) * 2021-07-14 2021-11-12 阿里巴巴(中国)有限公司 无障碍模式下的设备控制方法、控制方法及设备
CN114463730B (zh) * 2021-07-15 2023-07-14 荣耀终端有限公司 一种页面识别方法及终端设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9583097B2 (en) * 2015-01-30 2017-02-28 Google Inc. Dynamic inference of voice command for software operation from help information
US9934782B2 (en) * 2015-09-22 2018-04-03 Meshrose Ltd. Automatic performance of user interaction operations on a computing device
CN105551492A (zh) * 2015-12-04 2016-05-04 青岛海信传媒网络技术有限公司 语音控制的方法、装置与终端
CN107025046A (zh) * 2016-01-29 2017-08-08 阿里巴巴集团控股有限公司 终端应用语音操作方法及***
CN106325889A (zh) * 2016-09-30 2017-01-11 北京奇点机智信息技术有限公司 数据处理方法及装置
CN107045873A (zh) * 2016-12-06 2017-08-15 深圳市全智达科技有限公司 一种语音操作方法及装置
CN106898349A (zh) * 2017-01-11 2017-06-27 梅其珍 一种语音控制计算机的方法和智能语音助手***

Also Published As

Publication number Publication date
CN108153574A (zh) 2018-06-12

Similar Documents

Publication Publication Date Title
US11735182B2 (en) Multi-modal interaction between users, automated assistants, and other computing services
US20190068527A1 (en) Method and system for conducting an automated conversation with a virtual agent system
US20170092273A1 (en) Intelligent contextually aware digital assistants
US10860289B2 (en) Flexible voice-based information retrieval system for virtual assistant
US10693827B2 (en) Determining intended electronic message recipients via linguistic profiles
CN110797022B (zh) 一种应用控制方法、装置、终端和服务器
CN116628157A (zh) 对话***中的参数收集和自动对话生成
CN108768824B (zh) 信息处理方法及装置
US10042840B2 (en) Hybrid grammatical and ungrammatical parsing
CN102945120B (zh) 一种基于儿童应用中的人机交互辅助***及交互方法
JP6434640B2 (ja) メッセージ表示方法、メッセージ表示装置、およびメッセージ表示デバイス
EP4113357A1 (en) Method and apparatus for recognizing entity, electronic device and storage medium
JP2020004382A (ja) 音声対話方法及び装置
CN112286485B (zh) 通过语音控制应用的方法、装置、电子设备与存储介质
CA3166742A1 (en) Method of generating text plan based on deep learning, device and electronic equipment
CN115309877A (zh) 对话生成方法、对话模型训练方法及装置
CN116303962B (zh) 对话生成方法、深度学习模型的训练方法、装置和设备
CN104184890A (zh) 一种信息处理方法及电子设备
CN108153574B (zh) 应用程序处理方法、装置及电子设备
CN108306813B (zh) 会话消息的处理方法、服务器及客户端
CN114974253A (zh) 一种基于人物画像的自然语言解释方法、装置及存储介质
CN106599179B (zh) 融合知识图谱和记忆图谱的人机对话控制方法及装置
CN107623620B (zh) 随机***互数据的处理方法、网络服务器及智能对话***
CN110874176B (zh) 交互方法、存储介质、操作***和设备
CN107622769B (zh) 号码修改方法及装置、存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant