CN112231032A - 结合rpa与ai的软件界面元素的访问方法及装置 - Google Patents
结合rpa与ai的软件界面元素的访问方法及装置 Download PDFInfo
- Publication number
- CN112231032A CN112231032A CN202011125498.6A CN202011125498A CN112231032A CN 112231032 A CN112231032 A CN 112231032A CN 202011125498 A CN202011125498 A CN 202011125498A CN 112231032 A CN112231032 A CN 112231032A
- Authority
- CN
- China
- Prior art keywords
- interface
- anchor point
- information
- interface element
- software
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000010586 diagram Methods 0.000 claims abstract description 61
- 238000012015 optical character recognition Methods 0.000 claims abstract description 21
- 238000005516 engineering process Methods 0.000 claims abstract description 15
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 description 25
- 238000013461 design Methods 0.000 description 14
- 238000004801 process automation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Character Input (AREA)
Abstract
本公开提供一种结合RPA与AI的软件界面元素的访问方法、装置、设备及存储介质。本实施例提供的软件界面元素的访问方法,包括通过获取当前软件界面对应的模板特征图;根据所述模板特征图,采用光学字符识别(Optical Character Recognition,OCR)技术,确定所述当前软件界面上的目标锚点信息;根据所述目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息;根据所述分布信息,执行对所述界面元素的访问操作。从而可以对不支持UIA接口的软件界面上的界面元素进行访问处理,提高软件机器人的访问能力,实现方式简单,结果稳定可靠。
Description
技术领域
本公开涉及自动化技术领域,具体涉及RPA(Robotic Process Automation,机器人流程自动化)、AI(Artificial Intelligence,人工智能),尤其涉及一种结合RPA与AI的软件界面元素的访问方法及装置。
背景技术
在机器人流程自动化(Robotic Process Automation,RPA)领域,为了实现流程的自动化,软件机器人需要经常访问软件界面上的控件元素(简称界面元素),并针对这些界面元素进行操作,以执行相应的操作任务。
人工智能(Artificial Intelligence,简称AI)是研究、开发用于模拟、延伸和扩展人智能的理论、方法、技术及应用***的一门新技术科学。人工智能领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家***等。
现有技术中,软件机器人一般是通过Microsoft用户界面自动化(Microsoft UserInterface Automation,UIA)接口获取到软件界面元素,然后执行相应的操作任务。
但是,当软件界面不支持UIA接口访问时,软件机器人就无法对软件界面元素进行正常访问。
发明内容
本公开提供一种结合RPA与AI的软件界面元素的访问方法、装置、设备及存储介质,可以对不支持UIA接口的软件界面上的界面元素进行访问处理,提高软件机器人的访问能力。
第一方面,本公开提供一种结合RPA与AI的软件界面元素的访问方法,包括:
获取当前软件界面对应的模板特征图;
根据所述模板特征图,采用光学字符识别(Optical Character Recognition,OCR)技术,确定所述当前软件界面上的目标锚点信息;
根据所述目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息;
根据所述分布信息,执行对所述界面元素的访问操作。
在一种可能的设计中,所述获取当前软件界面对应的模板特征图,包括:
根据所述当前软件界面的软件标识信息,从存储器中搜索与所述软件标识信息匹配的模板特征图;其中,所述存储器中预先加载有模板特征图,以及所述模板特征图与软件标识信息之间的映射关系;或者,
根据当前软件界面的图像,从存储器中搜索与所述当前软件界面的图像匹配的模板特征图。
在一种可能的设计中,所述目标锚点信息包括:锚点区域、锚点区域与界面元素之间的关联信息;其中,所述锚点区域包括:形态不变的图标元素、文本元素、按键元素中的任一或任多项元素区域。
在一种可能的设计中,根据所述目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息,包括:
根据锚点区域、锚点区域与界面元素之间的关联信息,确定至少一个界面元素在当前软件界面上的分布信息;所述分布信息包括:界面元素的至少一个形状点的坐标信息、界面元素的尺寸信息;其中,所述形状点用于界定所述界面元素包含的区域;所述关联信息包括:所述锚点区域对应的坐标信息与所述界面元素的对应的坐标信息之间的坐标换算关系。
在一种可能的设计中,在获取当前软件界面对应的模板特征图之前,还包括:
根据软件界面的图像,生成模板特征图。
在一种可能的设计中,所述根据软件界面的图像,生成模板特征图,包括:
在运行软件时,截取软件界面的图像;
在所述软件界面的图像中,标注锚点区域和界面元素;
根据所述锚点区域对应的坐标信息和所述界面元素对应的坐标信息,确定所述锚点区域与所述界面元素之间的关联信息;
根据所述软件界面的图像、标注的锚点区域和界面元素,以及所述锚点区域与所述界面元素之间的关联信息,生成所述软件对应的模板特征图。
第二方面,本公开还提供一种结合RPA与AI的软件界面元素的访问装置,包括:
获取模块,用于获取当前软件界面对应的模板特征图;
第一确定模块,用于根据所述模板特征图,采用光学字符识别(OpticalCharacter Recognition,OCR)技术,确定所述当前软件界面上的目标锚点信息;
第二确定模块,用于根据所述目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息;
访问模块,用于根据所述分布信息,执行对所述界面元素的访问操作。
在一种可能的设计中,所述获取模块,具体用于:
根据所述当前软件界面的软件标识信息,从存储器中搜索与所述软件标识信息匹配的模板特征图;其中,所述存储器中预先加载有模板特征图,以及所述模板特征图与软件标识信息之间的映射关系;或者,
根据当前软件界面的图像,从存储器中所述与所述当前软件界面的图像匹配的模板特征图。
在一种可能的设计中,所述目标锚点信息包括:锚点区域、锚点区域与界面元素之间的关联信息;其中,所述锚点区域包括:形态不变的图标元素、文本元素、按键元素中的任一或任多项元素区域。
在一种可能的设计中,所述第二确定模块,具体用于:
根据锚点区域、锚点区域与界面元素之间的关联信息,确定至少一个界面元素在当前软件界面上的分布信息;所述分布信息包括:界面元素的至少一个形状点的坐标信息、界面元素的尺寸信息;其中,所述形状点用于界定所述界面元素包含的区域;所述关联信息包括:所述锚点区域对应的坐标信息与所述界面元素的对应的坐标信息之间的坐标换算关系。
在一种可能的设计中,还包括:模板生成模块,用于:
根据软件界面的图像,生成模板特征图。
在一种可能的设计中,所述模板生成模块:具体用于:
在运行软件时,截取软件界面的图像;
在所述软件界面的图像中,标注锚点区域和界面元素;
根据所述锚点区域对应的坐标信息和所述界面元素对应的坐标信息,确定所述锚点区域与所述界面元素之间的关联信息;
根据所述软件界面的图像、标注的锚点区域和界面元素,以及所述锚点区域与所述界面元素之间的关联信息,生成所述软件对应的模板特征图。
第三方面,本公开还提供一种电子设备,包括:
处理器;以及,
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行第一方面中任意一种结合RPA与AI的软件界面元素的访问方法。
第四方面,本公开实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任意一种结合RPA与AI的软件界面元素的访问方法。
本公开提供一种结合RPA与AI的软件界面元素的访问方法、装置、设备及存储介质,通过获取当前软件界面对应的模板特征图;根据所述模板特征图,采用OCR技术,确定所述当前软件界面上的目标锚点信息;根据所述目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息;根据所述分布信息,执行对所述界面元素的访问操作。从而可以对不支持UIA接口的软件界面上的界面元素进行访问处理,提高软件机器人的访问能力,实现方式简单,结果稳定可靠。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开根据一示例实施例示出的结合RPA与AI的软件界面元素的访问方法的应用场景图;
图2为本公开根据一示例实施例示出的结合RPA与AI的软件界面元素的访问方法的流程示意图;
图3为本公开根据另一示例实施例示出的结合RPA与AI的软件界面元素的访问方法的流程示意图;
图4为本公开根据一示例实施例示出的结合RPA与AI的软件界面元素的访问装置的结构示意图;
图5为本公开根据另一示例实施例示出的结合RPA与AI的软件界面元素的访问装置的结构示意图;
图6为本公开根据一示例实施例示出的电子设备的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在机器人流程自动化(Robotic Process Automation,RPA)领域,为了实现流程的自动化,软件机器人需要经常访问软件界面上的控件元素(简称界面元素),并针对这些界面元素进行操作,以执行相应的操作任务。现有技术中,软件机器人一般是通过Microsoft用户界面自动化(Microsoft User Interface Automation,UIA)接口获取到软件界面元素,然后执行相应的操作任务。但是,当软件界面不支持UIA接口访问时,软件机器人就无法对软件界面元素进行正常访问。
针对上述技术问题,本公开提供一种结合RPA与AI的软件界面元素的访问方法、装置、设备及存储介质,可以对不支持UIA接口的软件界面上的界面元素进行访问处理,提高软件机器人的访问能力。图1为本公开根据一示例实施例示出的结合RPA与AI的软件界面元素的访问方法的应用场景图,如图1所示,由于控件元素在界面中的相对位置或控件元素本身的大小与形态都有可能是动态变化的。如PC版微信界面,其聊天输入框区域就可以随意拖动放大或缩小。因此,本公开实施例中,可以将软件界面中稳定不变的区域标注成锚点区域。锚点区域可以是形态不变的图标元素、文本元素、按键元素中的任一或任多项元素区域,但锚点区域在界面中必须是唯一且稳定可查找的;锚点区域数量不限,以软件界面的复杂度来定。具体地,锚点区域可以理解为参照区域,该参照区域的形态必须保持不变。例如以圆形图标作为锚点区域,则无论该图标在界面的哪个位置显示,其形状必然是圆形的。除了图标这种常见的元素之外,还可以设置界面上的文本字符作为锚点区域,例如某一输入框的右下角一般都有文本字符,例如“确认”、“取消”、“发送”等等,此时可以将这些文本字符对应的区域作为锚点区域,用来界定输入框的位置。类似地,按键元素作为具备一定形状的控件,只要其形状保持不变,则也可以作为锚点区域,用以对界面元素的分布区域进行定位。需要说明的是,本领域技术人员,可以根据实际的软件界面选择锚点区域的数量和类型。例如当软件界面上的界面元素面积较大,且其包含的区域为不规则图形时,则需要更多的锚点区域对该界面元素进行界定。另外,锚点区域对应的图标元素、文本元素或按键元素需要在界面上是唯一存在的,例如,界面上存在两个形状相同的图标元素,或者两个文本相同的文本元素,则该图标元素、文本元素对应的元素区域不能作为锚点区域。目标锚点信息除了锚点区域信息之外,还包括锚点区域与界面元素之间的关联信息。在模板特征图中记录有目标锚点信息,可以直接提取模板特征图中的目标锚点信息。如图1中所示的PC版微信界面中,可以将表情图标元素作为锚点1,将发送按键作为锚点2。控件区域是机器人需要访问的界面元素,例如PC版微信界面中聊天信息输入框区域。界面元素的分布信息可以用形状点来描述,形状点可以是界面元素的顶点或者是界面元素的中心点。矩形界面元素的分布信息可以用四个顶点来描述,而圆形界面元素的分布信息可以用中心点来描述。例如圆形的界面元素(圆形按钮),知道圆心位置和圆的半径,即可确定界面元素的区域。根据锚点区域对应的坐标信息与界面元素的对应的坐标信息之间的坐标换算关系,可以很快确定界面元素形状点的坐标,进而确定界面元素所在的位置坐标和尺寸大小等信息。例如,在PC版微信界面中,可以根据锚点1的区域信息确定控件区域左上角的形状点的位置信息,根据锚点2的区域信息确定控件区域右下角的形状点的位置信息,从而确定控件区域的分布信息。在获取到界面元素的分布信息之后,可以对界面元素进行访问,例如对界面元素的拾取与模拟操作。
应用上述方法可以对不支持UIA接口的软件界面上的界面元素进行访问处理,提高软件机器人的访问能力,实现方式简单,结果稳定可靠。
图2为本公开根据一示例实施例示出的结合RPA与AI的软件界面元素的访问方法的流程示意图,如图2所示,本实施例提供的方法可以包括:
步骤101、获取当前软件界面对应的模板特征图。
本实施例中,软件机器人可以根据当前软件界面的软件标识信息,从存储器中搜索与软件标识信息匹配的模板特征图;其中,存储器中预先加载有模板特征图,以及模板特征图与软件标识信息之间的映射关系;或者,软件机器人也可以根据当前软件界面的图像,从存储器中搜索与当前软件界面的图像匹配的模板特征图。
具体地,在一种实施方式中,可以在存储器中存储模板特征图和软件界面的标识信息,通过当前软件界面的标识信息来搜索并获取对应的模板特征图。软件界面的标识信息可以包括应用名称,还可以包括界面信息,例如主页、对话界面等,还可以包括软件版本号等信息。在另一种实施方式中,可以通过图像识别技术,根据当前软件界面的图像,从存储器中搜索与当前软件界面图像匹配的模板特征图。
需要说明的是,本实施例不限定模板特征图获取的方式,可以是通过软件界面的标识信息获取,也可以是通过图像识别技术进行匹配,还可以是两者的结合。
步骤102、根据模板特征图,采用光学字符识别(Optical CharacterRecognition,OCR)技术,确定当前软件界面上的目标锚点信息。
本实施例中,目标锚点信息包括:锚点区域、锚点区域与界面元素之间的关联信息;其中,锚点区域包括:形态不变的图标元素、文本元素、按键元素中的任一或任多项元素区域。
具体地,可以将软件界面中形态不变的区域标注成锚点区域。锚点区域可以是形态不变的图标元素、文本元素、按键元素中的任一或任多项元素区域,但锚点区域在界面中必须是唯一且稳定可查找的;锚点区域数量不限,以软件界面的复杂度来定。目标锚点信息除了锚点区域信息之外,还包括锚点区域与界面元素之间的关联信息。在模板特征图中记录有目标锚点信息,可以直接提取模板特征图中的目标锚点信息。
本实施例中,目标锚点信息可以文本形式记录在模板特征图中,比如以文本形式标注出模板特征图中的锚点区域,并记录锚点区域与界面元素的关联信息,从而软件机器人在获取模板特征图后,可以采用OCR技术,从模板特征图中提取目标锚点信息。
步骤103、根据目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息。
本实施例中,根据目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息,包括:根据锚点区域、锚点区域与界面元素之间的关联信息,确定至少一个界面元素在当前软件界面上的分布信息;分布信息包括:界面元素的至少一个形状点的坐标信息、界面元素的尺寸信息;其中,形状点用于界定界面元素包含的区域;关联信息包括:锚点区域对应的坐标信息与界面元素的对应的坐标信息之间的坐标换算关系。
具体地,由于控件元素在界面中的相对位置或控件元素本身的大小与形态都有可能是动态变化的。如PC版微信界面,其聊天输入框区域就可以随意拖动放大或缩小。因此,锚点区域与界面元素之间的关联信息,表明了控件元素与锚点之间的关系,通过稳定不变的锚点来确定控件所在的位置与大小。界面元素的分布信息可以用形状点来描述,形状点可以是界面元素的顶点或者是界面元素的中心点。矩形界面元素的分布信息可以用四个顶点来描述,而圆形界面元素的分布信息可以用中心点来描述。例如圆形的界面元素(圆形按钮),知道圆心位置和圆的半径,即可确定界面元素的区域。根据锚点区域对应的坐标信息与界面元素的对应的坐标信息之间的坐标换算关系,可以很快确定界面元素形状点的坐标,进而确定界面元素所在的位置坐标和尺寸大小等信息。
步骤104、根据分布信息,执行对界面元素的访问操作。
本实施例中,在获取到界面元素的分布信息之后,可以对界面元素进行访问,例如对界面元素的拾取与模拟操作。
本实施例,通过获取当前软件界面对应的模板特征图;根据模板特征图,采用OCR技术,确定当前软件界面上的目标锚点信息;根据目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息;根据分布信息,执行对界面元素的访问操作。从而可以对不支持UIA接口的软件界面上的界面元素进行访问处理,提高软件机器人的访问能力,实现方式简单,结果稳定可靠。
图3为本公开根据另一示例实施例示出的结合RPA与AI的软件界面元素的访问方法的流程示意图,如图3所示,本实施例提供的方法可以包括:
步骤201、根据软件界面的图像,生成模板特征图。
本实施例中,在运行软件时,截取软件界面的图像;在软件界面的图像中,标注锚点区域和界面元素;根据锚点区域对应的坐标信息和界面元素对应的坐标信息,确定锚点区域与界面元素之间的关联信息;根据软件界面的图像、标注的锚点区域和界面元素,以及锚点区域与界面元素之间的关联信息,生成软件对应的模板特征图。
具体地,还可以截取软件界面,通过手动或者自动标注的方式生成软件界面对应的模板特征图。在实现过程中,针对机器人待访问的软件界面,首先截取该界面的图像,以该图像为基础实现自定义模板的生成。然后,标注锚点区域。该步骤即是将软件界面中形态不变的区域标注成锚点区域。锚点区域可以是图标或文本,但锚点区域在界面中必须是唯一且稳定可查找的;锚点区域数量不限,以软件界面的复杂度来定。然后,标注控件元素区域。可以将软件界面中的控件元素所在的区域标注出来,这些区域即是机器人需要访问的界面元素。然后,建立控件元素与锚点的关联关系。由于控件元素在界面中的相对位置或控件元素本身的大小与形态都有可能是动态变化的。如PC版微信界面,其聊天输入框区域就可以随意拖动放大或缩小。因此,需要将控件元素与锚点关系起来,通过稳定不变的锚点来确定控件所在的位置与大小。最后,根据软件界面的图像、标注的锚点区域,以及锚点区域与界面元素之间的关联信息,生成软件对应的模板特征图。
本实施例中,在软件界面中标注锚点区域、控件元素所在的区域、锚点区域与界面元素之间的关联信息等信息时,可以文本形式进行标注,从而使生成的模板特征图中具有文本形式的目标锚点信息。
步骤202、获取当前软件界面对应的模板特征图。
步骤203、根据模板特征图,采用OCR技术,确定当前软件界面上的目标锚点信息。
步骤204、根据目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息。
步骤205、根据分布信息,执行对界面元素的访问操作。
本实施例中,步骤202~步骤205的具体实现过程和技术原理请参见图2所示的方法中步骤101~步骤104中的相关描述,此处不再赘述。
本实施例,通过获取当前软件界面对应的模板特征图;根据模板特征图,采用OCR技术确定当前软件界面上的目标锚点信息;根据目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息;根据分布信息,执行对界面元素的访问操作。从而可以对不支持UIA接口的软件界面上的界面元素进行访问处理,提高软件机器人的访问能力,实现方式简单,结果稳定可靠。
另外,本实施例还可以根据软件界面的图像,生成模板特征图,从而可以对不支持UIA接口的软件界面上的界面元素进行访问处理,提高软件机器人的访问能力,实现方式简单,结果稳定可靠。
图4为本公开根据一示例实施例示出的结合RPA与AI的软件界面元素的访问装置的结构示意图。如图4所示,本实施例的结合RPA与AI的软件界面元素的访问装置可以包括:
获取模块31,用于获取当前软件界面对应的模板特征图;
第一确定模块32,用于根据模板特征图,采用光学字符识别(Optical CharacterRecognition,OCR)技术,确定当前软件界面上的目标锚点信息;
第二确定模块33,用于根据目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息;
访问模块34,用于根据分布信息,执行对界面元素的访问操作。
在一种可能的设计中,获取模块31,具体用于:
根据当前软件界面的软件标识信息,从存储器中搜索与软件标识信息匹配的模板特征图;其中,存储器中预先加载有模板特征图,以及模板特征图与软件标识信息之间的映射关系;或者,
根据当前软件界面的图像,从存储器中与当前软件界面的图像匹配的模板特征图。
在一种可能的设计中,目标锚点信息包括:锚点区域、锚点区域与界面元素之间的关联信息;其中,锚点区域包括:形态不变的图标元素、文本元素、按键元素中的任一或任多项元素区域。
在一种可能的设计中,第二确定模块33,具体用于:
根据锚点区域、锚点区域与界面元素之间的关联信息,确定至少一个界面元素在当前软件界面上的分布信息;分布信息包括:界面元素的至少一个形状点的坐标信息、界面元素的尺寸信息;其中,形状点用于界定界面元素包含的区域;关联信息包括:锚点区域对应的坐标信息与界面元素的对应的坐标信息之间的坐标换算关系。
本实施例提供的装置,可以用于执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本实施例,通过获取当前软件界面对应的模板特征图;根据模板特征图,采用OCR技术,确定当前软件界面上的目标锚点信息;根据目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息;根据分布信息,执行对界面元素的访问操作。从而可以对不支持UIA接口的软件界面上的界面元素进行访问处理,提高软件机器人的访问能力,实现方式简单,结果稳定可靠。
在图4所示实施例的基础上,图5为本公开根据另一示例实施例示出的结合RPA与AI的软件界面元素的访问装置的结构示意图,如图5所示,本实施例提供的结合RPA与AI的软件界面元素的访问装置,还包括:
模板生成模块35,用于:
根据软件界面的图像,生成模板特征图。
在一种可能的设计中,模板生成模块35:具体用于:
在运行软件时,截取软件界面的图像;
在软件界面的图像中,标注锚点区域和界面元素;
根据锚点区域对应的坐标信息和界面元素对应的坐标信息,确定锚点区域与界面元素之间的关联信息;
根据软件界面的图像、标注的锚点区域和界面元素,以及锚点区域与界面元素之间的关联信息,生成软件对应的模板特征图。
本实施例提供的装置,可以用于执行图2、图3所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本实施例,通过获取当前软件界面对应的模板特征图;根据模板特征图,采用OCR技术,确定当前软件界面上的目标锚点信息;根据目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息;根据分布信息,执行对界面元素的访问操作。从而可以对不支持UIA接口的软件界面上的界面元素进行访问处理,提高软件机器人的访问能力,实现方式简单,结果稳定可靠。
另外,本实施例还可以根据软件界面的图像,生成模板特征图,从而可以对不支持UIA接口的软件界面上的界面元素进行访问处理,提高软件机器人的访问能力,实现方式简单,结果稳定可靠。
图6为本公开根据一示例实施例示出的电子设备的结构示意图。如图6所示,本实施例提供的一种电子设备40,包括:
处理器401;以及,
存储器402,用于存储处理器的可执行指令,该存储器还可以是flash(闪存);
其中,处理器401配置为经由执行可执行指令来执行上述方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。
可选地,存储器402既可以是独立的,也可以跟处理器401集成在一起。
当存储器402是独立于处理器401之外的器件时,电子设备40,还可以包括:
总线403,用于连接处理器401以及存储器402。
本实施例还提供一种可读存储介质,可读存储介质中存储有计算机程序,当电子设备的至少一个处理器执行该计算机程序时,电子设备执行上述的各种实施方式提供的方法。
本实施例还提供一种程序产品,该程序产品包括计算机程序,该计算机程序存储在可读存储介质中。电子设备的至少一个处理器可以从可读存储介质读取该计算机程序,至少一个处理器执行该计算机程序使得电子设备实施上述的各种实施方式提供的方法。
最后应说明的是:以上各实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述各实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的范围。
Claims (13)
1.一种结合RPA与AI的软件界面元素的访问方法,其特征在于,包括:
获取当前软件界面对应的模板特征图;
根据所述模板特征图,采用光学字符识别(Optical Character Recognition,OCR)技术,确定所述当前软件界面上的目标锚点信息;
根据所述目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息;
根据所述分布信息,执行对所述界面元素的访问操作。
2.根据权利要求1所述的方法,其特征在于,所述获取当前软件界面对应的模板特征图,包括:
根据所述当前软件界面的软件标识信息,从存储器中搜索与所述软件标识信息匹配的模板特征图;其中,所述存储器中预先加载有模板特征图,以及所述模板特征图与软件标识信息之间的映射关系;或者,
根据当前软件界面的图像,从存储器中搜索与所述当前软件界面的图像匹配的模板特征图。
3.根据权利要求1所述的方法,其特征在于,所述目标锚点信息包括:锚点区域、锚点区域与界面元素之间的关联信息;其中,所述锚点区域包括:形态不变的图标元素、文本元素、按键元素中的任一或任多项元素区域。
4.根据权利要求3所述的方法,其特征在于,根据所述目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息,包括:
根据锚点区域、锚点区域与界面元素之间的关联信息,确定至少一个界面元素在当前软件界面上的分布信息;所述分布信息包括:界面元素的至少一个形状点的坐标信息、界面元素的尺寸信息;其中,所述形状点用于界定所述界面元素包含的区域;所述关联信息包括:所述锚点区域对应的坐标信息与所述界面元素的对应的坐标信息之间的坐标换算关系。
5.根据权利要求1-4中任一项所述的方法,其特征在于,在获取当前软件界面对应的模板特征图之前,还包括:
根据软件界面的图像,生成模板特征图。
6.根据权利要求5所述的方法,其特征在于,所述根据软件界面的图像,生成模板特征图,包括:
在运行软件时,截取软件界面的图像;
在所述软件界面的图像中,标注锚点区域和界面元素;
根据所述锚点区域对应的坐标信息和所述界面元素对应的坐标信息,确定所述锚点区域与所述界面元素之间的关联信息;
根据所述软件界面的图像、标注的锚点区域和界面元素,以及所述锚点区域与所述界面元素之间的关联信息,生成所述软件对应的模板特征图。
7.一种结合RPA与AI的软件界面元素的访问装置,其特征在于,包括:
获取模块,用于获取当前软件界面对应的模板特征图;
第一确定模块,用于根据所述模板特征图,采用光学字符识别(Optical CharacterRecognition,OCR)技术,确定所述当前软件界面上的目标锚点信息;
第二确定模块,用于根据所述目标锚点信息,确定至少一个界面元素在当前软件界面上的分布信息;
访问模块,用于根据所述分布信息,执行对所述界面元素的访问操作。
8.根据权利要求7所述的装置,其特征在于,所述目标锚点信息包括:锚点区域、锚点区域与界面元素之间的关联信息;其中,所述锚点区域包括:形态不变的图标元素、文本元素、按键元素中的任一或任多项元素区域。
9.根据权利要求8所述的装置,其特征在于,所述第二确定模块,具体用于:
根据锚点区域、锚点区域与界面元素之间的关联信息,确定至少一个界面元素在当前软件界面上的分布信息;所述分布信息包括:界面元素的至少一个形状点的坐标信息、界面元素的尺寸信息;其中,所述形状点用于界定所述界面元素包含的区域;所述关联信息包括:所述锚点区域对应的坐标信息与所述界面元素的对应的坐标信息之间的坐标换算关系。
10.根据权利要求7-9中任一项所述的装置,其特征在于,还包括:模板生成模块,用于:
根据软件界面的图像,生成模板特征图。
11.根据权利要求10所述的装置,其特征在于,所述模板生成模块:具体用于:
在运行软件时,截取软件界面的图像;
在所述软件界面的图像中,标注锚点区域和界面元素;
根据所述锚点区域对应的坐标信息和所述界面元素对应的坐标信息,确定所述锚点区域与所述界面元素之间的关联信息;
根据所述软件界面的图像、标注的锚点区域和界面元素,以及所述锚点区域与所述界面元素之间的关联信息,生成所述软件对应的模板特征图。
12.一种电子设备,其特征在于,包括:
处理器;以及,
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至6中任一项所述的结合RPA与AI的软件界面元素的访问方法。
13.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至6中任一项所述的结合RPA与AI的软件界面元素的访问方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911254717 | 2019-12-10 | ||
CN2019112547178 | 2019-12-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112231032A true CN112231032A (zh) | 2021-01-15 |
Family
ID=74118574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011125498.6A Pending CN112231032A (zh) | 2019-12-10 | 2020-10-20 | 结合rpa与ai的软件界面元素的访问方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112231032A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113176921A (zh) * | 2021-04-30 | 2021-07-27 | 上海云扩信息科技有限公司 | 一种桌面自动化定制化*** |
CN115455227A (zh) * | 2022-09-20 | 2022-12-09 | 上海弘玑信息技术有限公司 | 图形界面的元素搜索方法及电子设备、存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110119609A1 (en) * | 2009-11-16 | 2011-05-19 | Apple Inc. | Docking User Interface Elements |
CN104899146A (zh) * | 2015-06-19 | 2015-09-09 | 安一恒通(北京)科技有限公司 | 基于图像匹配技术的软件稳定性测试方法和装置 |
CN107463327A (zh) * | 2017-07-20 | 2017-12-12 | 福建网龙计算机网络信息技术有限公司 | 一种获取界面控件元素位置信息的方法及终端 |
CN109408367A (zh) * | 2018-09-03 | 2019-03-01 | 深圳壹账通智能科技有限公司 | 一种识别交互界面的控件元素的方法及终端 |
CN110413529A (zh) * | 2019-07-31 | 2019-11-05 | 中国工商银行股份有限公司 | 应用于电子设备的测试方法、装置、计算设备以及介质 |
-
2020
- 2020-10-20 CN CN202011125498.6A patent/CN112231032A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110119609A1 (en) * | 2009-11-16 | 2011-05-19 | Apple Inc. | Docking User Interface Elements |
CN104899146A (zh) * | 2015-06-19 | 2015-09-09 | 安一恒通(北京)科技有限公司 | 基于图像匹配技术的软件稳定性测试方法和装置 |
CN107463327A (zh) * | 2017-07-20 | 2017-12-12 | 福建网龙计算机网络信息技术有限公司 | 一种获取界面控件元素位置信息的方法及终端 |
CN109408367A (zh) * | 2018-09-03 | 2019-03-01 | 深圳壹账通智能科技有限公司 | 一种识别交互界面的控件元素的方法及终端 |
CN110413529A (zh) * | 2019-07-31 | 2019-11-05 | 中国工商银行股份有限公司 | 应用于电子设备的测试方法、装置、计算设备以及介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113176921A (zh) * | 2021-04-30 | 2021-07-27 | 上海云扩信息科技有限公司 | 一种桌面自动化定制化*** |
CN113176921B (zh) * | 2021-04-30 | 2023-09-19 | 上海云扩信息科技有限公司 | 一种桌面自动化定制化*** |
CN115455227A (zh) * | 2022-09-20 | 2022-12-09 | 上海弘玑信息技术有限公司 | 图形界面的元素搜索方法及电子设备、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9349076B1 (en) | Template-based target object detection in an image | |
US8943468B2 (en) | Wireframe recognition and analysis engine | |
US20140099002A1 (en) | Apparatus and method for providing digital drawing | |
CN112231033A (zh) | 结合rpa与ai的软件界面元素的匹配方法及装置 | |
CN112231032A (zh) | 结合rpa与ai的软件界面元素的访问方法及装置 | |
CN108882025B (zh) | 视频帧处理方法和装置 | |
US9355338B2 (en) | Image recognition device, image recognition method, and recording medium | |
CN112231034A (zh) | 结合rpa和ai的软件界面元素的识别方法与装置 | |
US9798650B1 (en) | Application testing system and method | |
CN111562870B (zh) | 地图点位图标扩展处理方法及装置 | |
CN109858402B (zh) | 一种图像检测方法、装置、终端以及存储介质 | |
CN115035367A (zh) | 图片识别方法、装置及电子设备 | |
CN112911266A (zh) | 基于增强现实技术的物联网实训***的实现方法及*** | |
CN117033309A (zh) | 一种数据转换方法、装置、电子设备及可读存储介质 | |
CN115359203B (zh) | 一种三维高精度地图生成方法、***及云平台 | |
JP2020013567A (ja) | 画像処理方法、画像処理装置及び画像処理機器 | |
CN114511653A (zh) | 具有自动符号检测的进度跟踪 | |
CN110909739B (zh) | 图片识别并操作的方法、装置、计算机设备及存储介质 | |
CN108733304A (zh) | 一种自动识别及处理手写字符方法、装置 | |
JP7359207B2 (ja) | 多角形検索方法 | |
CN112464753A (zh) | 图像中关键点的检测方法、检测装置及终端设备 | |
Satish et al. | ARTSAM: Augmented Reality App for Tool Selection in Aircraft Maintenance | |
CN115455227B (zh) | 图形界面的元素搜索方法及电子设备、存储介质 | |
JP2019114018A (ja) | 情報処理システム、情報処理システムの制御方法、およびプログラム | |
US12046019B2 (en) | Surface automation in black box environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |