CN117830666A - 一种图像匹配方法、装置、设备及介质 - Google Patents
一种图像匹配方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117830666A CN117830666A CN202410188202.7A CN202410188202A CN117830666A CN 117830666 A CN117830666 A CN 117830666A CN 202410188202 A CN202410188202 A CN 202410188202A CN 117830666 A CN117830666 A CN 117830666A
- Authority
- CN
- China
- Prior art keywords
- candidate key
- key elements
- target
- image
- target image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000004044 response Effects 0.000 claims abstract description 14
- 238000004590 computer program Methods 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000003708 edge detection Methods 0.000 claims description 4
- 238000003709 image segmentation Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种图像匹配方法、装置、设备及介质,该图像匹配方法包括:从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于候选关键元素和候选关键元素的位置信息为目标图像构建元素树;响应于元素选择指令从元素树中确定目标关键元素,并为目标关键元素生成CSS选择器;基于CSS选择器匹配目标图像中的候选关键元素。通过上述技术方案,提高了图像匹配的准确性以及匹配效率。
Description
技术领域
本发明涉及计算机视觉和图像处理技术领域,尤其涉及一种图像匹配方法、装置、设备及介质。
背景技术
在图像处理领域,直接从一整张大图中查找匹配的小图是一项具有挑战性的任务。
目前的解决方案主要分为两类:基于传统图像处理技术的局部特征匹配和基于深度学习的全局特征匹配。但传统图像处理技术的局部特征匹配通常采用局部特征提取和匹配的方式来实现图像匹配,例如,SIFT(Scale-Invariant Feature Transform,尺度不变特征转换)和SURF(Speeded Up Robust Features,加速稳健特征)等,虽然在一定程度上能够实现匹配,但受限于对光照、视角变化的敏感性,难以应对复杂场景和大规模图像。而基于深度学习的全局特征匹配,通常具有较高的算法复杂度,匹配效率较低。
发明内容
本发明提供了一种图像匹配方法、装置、设备及介质,以避免图像匹配处理中的误差,以及提高图像匹配处理效率。
根据本发明的一方面,提供了一种图像匹配方法,该方法包括:
从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于所述候选关键元素和候选关键元素的位置信息为所述目标图像构建元素树;
响应于元素选择指令从所述元素树中确定目标关键元素,并为所述目标关键元素生成CSS选择器;
基于所述CSS选择器匹配所述目标图像中的候选关键元素,使所述目标关键元素切换到可编辑状态。
根据本发明的另一方面,提供了一种图像匹配装置,该装置包括:
元素树构建模块,用于从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于所述候选关键元素和候选关键元素的位置信息为所述目标图像构建元素树;
选择器生成模块,用于响应于元素选择指令从所述元素树中确定目标关键元素,并为所述目标关键元素生成CSS选择器;
编辑模块,用于基于所述CSS选择器匹配所述目标图像中的候选关键元素,使所述目标关键元素切换到可编辑状态。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的图像匹配方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的图像匹配方法。
本发明实施例的技术方案,基于目标图像中所识别到的候选关键元素和候选关键元素的位置信息构建目标图像对应的元素树,通过从元素树中确定目标关键元素,并为目标关键元素生成CSS选择器,基于CSS选择器匹配目标图像中的候选关键元素,提高了图像匹配的准确性以及匹配效率。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种图像匹配方法的流程图;
图2是根据本发明实施例二提供的一种图像匹配方法的流程图;
图3是根据本发明实施例三提供的一种图像匹配装置的结构示意图;
图4是实现本发明实施例的图像匹配方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供了一种图像匹配方法的流程图,本实施例可适用在一整张大图中查找匹配小图的情况,该方法可以由图像匹配装置来执行,该图像匹配装置可以采用硬件和/或软件的形式实现,该图像匹配装置可配置于各种通用计算设备中。如图1所示,该方法包括:
S110、从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于候选关键元素和候选关键元素的位置信息为目标图像构建元素树。
其中,目标图像可以是指需要进行图像识别的图像或视频帧,目标图像中至少包括至少两个子图像,子图像可以是指目标图像中能与目标图像的背景构成差异的区域。
候选关键元素可以是指目标图像中的子图像,候选关键元素的位置信息可以是指子图像在目标图像中所处的位置区域。
元素树可以用于存储目标图像的候选关键元素的元素特征以及候选关键元素的位置信息。可选的,元素特征用于表征候选关键元素的图像信息,可以包括候选关键元素的类型信息、文本信息以及位置信息中的至少一种;可选的,元素树可以为CV元素树。需要说明的是,类型信息用于表征候选关键元素的元素类型,例如,文本框、按钮以及输入框等,文本信息可以是指候选关键元素中的文字内容。
具体的,可以对目标图像进行图像识别,识别出目标图像中的候选关键元素和候选关键元素的位置信息,并根据候选关键元素和候选关键元素的位置信息为目标图像生成元素树。可选的,在元素树中,元素树中的候选关键元素都有其唯一确定的节点位置。
可选的,从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于候选关键元素和候选关键元素的位置信息为目标图像构建元素树,包括:基于边缘检测算法,对目标图像进行图像分割,识别出目标图像中的至少两个候选关键元素和候选关键元素的位置信息;基于预设的过滤连接组件,对至少两个候选关键元素进行筛选,将筛选后的候选关键元素用于构建元素树。
其中,过滤连接组件可以根据候选关键元素的位置信息确定,过滤连接组件可用于对候选关键元素的位置信息进行限定,筛选出位置区域不符合标准的候选关键元素,例如,长或宽小于预设长度的候选关键元素以及位置区域出现重叠的候选关键元素。可选的,预设长度可根据本领域技术人员进行适应性设置。
具体的,可以基于边缘检测算法,对目标图像中区别于目标图像背景的区域进行检测,对所检测到的图像区域进行切割,作为针对目标图像所识别到的候选关键元素,并识别出候选关键元素的位置信息;在确定目标图像中所存在的候选关键元素之后,可以基于预先设置的过滤连接组件,对目标图像中的至少两个候选关键元素进行筛选,将筛选后的候选关键元素用于构建目标图像的元素树。
通过边缘算法识别目标图像中的候选关键元素,可以有效提高识别候选关键元素的识别效率。
可选的,从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于候选关键元素和候选关键元素的位置信息为目标图像构建元素树,包括:基于预先训练好的图片识别模型,对目标图像中的候选关键元素进行识别;基于候选关键元素的位置信息,对所识别到的至少两个候选关键元素进行筛选;将筛选后的候选关键元素用于构建元素树。
其中,图片识别模型可以是基于YOLO(You Only Look Once,一种基于深度学习的实时目标检测算法)算法的卷积神经网络模型。
具体的,可以基于预先训练好的图片识别模型,对目标图像中的候选关键元素进行识别,根据所识别到的目标图像中候选关键元素的位置关系,对目标图像中的至少两个关键元素进行筛选,筛选掉位置区域不符合标准的候选关键元素,根据筛选后的候选关键元素构建目标图像的元素树。
通过预先训练好的图片识别模型,对目标图像中的候选关键元素进行识别,可以提高候选关键元素识别的准确率,以及能够在大规模图像中实现高效的图像识别。
S120、响应于元素选择指令从元素树中确定目标关键元素,并为目标关键元素生成CSS选择器。
其中,元素选择指令可以为用户发出的用于从元素书中确定候选关键元素的指令。可选的,元素选择指令可以为鼠标指令。
目标关键元素可以为在元素树中所确定的候选关键元素。
CSS选择器(CSS Selector,CSS)可以用于定义候选关键元素,CSS选择器可以用于代指与其对应的候选关键元素。需要说明的是,元素树中所存在的每一个候选关键元素都有其唯一确定的CSS选择器。
具体的,可以响应于元素选择指令从元素树中捕获候选关键元素作为目标关键元素,并为该目标关键元素生成对应的CSS选择器。
S130、基于CSS选择器匹配目标图像中的候选关键元素。
其中,CSS选择器可以有唯一确定的选择器标识。需要说明的是,在确定选择器标识的情况下,即确定了该选择器标识对应的CSS选择器。
具体的,可以直接根据所生成的CSS选择器,对目标图像中的候选关键元素进行定位匹配。
可选的,基于CSS选择器匹配目标图像中的候选关键元素,包括:基于选择器标识,确定出选择器标识对应的CSS选择器;通过CSS选择器,从目标图像中匹配所述CSS选择器所对应的候选关键元素。
具体的,可以通过确定选择器标识,确定出需要选定的CSS选择器,进而可直接根据所选定的CSS选择器与目标图像中对应的候选关键元素进行匹配。
可选的,基于CSS选择器匹配目标图像中的候选关键元素之后,还包括:基于CSS选择器使所匹配到的候选关键元素处于可编辑状态。
具体的,在通过CSS选择器对目标图像中的候选关键元素进行匹配定位后,可以通过该CSS选择器对该候选关键元素的元素特征进行编辑,示例性的,可以通过CSS选择器模拟对候选关键元素的点击,模拟对候选关键元素的文本输入编辑候选关键元素的文本信息,以及修改候选关键元素的位置信息。
本发明实施例的技术方案,基于目标图像中所识别到的候选关键元素和候选关键元素的位置信息构建目标图像对应的元素树,通过从元素树中确定目标关键元素,并为目标关键元素生成CSS选择器,基于CSS选择器匹配目标图像中的候选关键元素,避免了现有技术在大规模图像匹配处理中的低效和误差问题,提高了图像匹配的准确性以及匹配效率。
实施例二
图2为本发明实施例二提供的一种图像匹配方法的流程图,本实施例在上述实施例的基础上进一步细化,提供了响应于元素选择指令从元素树中确定目标关键元素,并为目标关键元素生成CSS选择器的具体步骤。需要说明的是,在本发明实施例未详述部分,可参见其他实施例的相关表述,在此不再赘述。如图2所示,该方法包括:
S210、从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于候选关键元素和候选关键元素的位置信息为目标图像构建元素树。
S220、响应于元素选择指令,在目标图像的至少两个候选关键元素中确定目标关键元素。
具体的,可以响应于元素选择指令,在元素树中所存储的目标图像的至少两个候选关键元素中确定目标关键元素。示例性的,可以基于鼠标在目标图像中的当前停留位置,并根据候选关键元素的位置信息所表示的位置区域,确定鼠标的当前停留位置所处位置区域的候选关键元素作为目标关键元素。
可选的,在确定目标关键元素之后,可对目标关键元素进行高亮显示,使用户能够直观的观察到所选择的目标关键元素,以避免因误触操作错误确定目标关键元素。
S230、针对目标关键元素,根据目标关键元素的元素特征为目标关键元素生成CSS选择器。
具体的,针对所确定的目标关键元素,可以根据目标关键元素的元素特征为该目标关键元素生成对应的CSS选择器。
可选的,根据目标关键元素的元素特征为目标关键元素生成CSS选择器,包括:根据目标关键元素的元素特征和目标关键元素的元素特征在元素树所处的节点信息生成CSS选择器中的标识字段;基于CSS选择器中的标识字段确定目标关键元素所对应的CSS选择器。
其中,标识字段可以用于定义目标关键元素,还可用于匹配目标图像中候选关键元素。
节点信息可以为目标关键元素在元素树中所处的节点位置。
具体的,可以根据目标关键元素的元素特征和目标关键元素在元素树所处的节点信息生成CSS选择器中的标识字段的字段内容,将携带有该标识字段的CSS选择器作为目标关键元素对应的CSS选择器。
基于目标关键元素的元素特征和目标关键元素的元素特征在元素树所处的节点信息生成目标元素对应的CSS选择器,能够在候选关键元素的元素特征一致的情况下,通过候选关键元素的在元素树中的节点信息区分目标图像中的候选关键元素,进一步提高了匹配准确率。另一方面,基于CV元素技术的图像匹配处理能够与其他自动化技术无缝衔接,扩大图像匹配处理的应用场景,例如,操控企业微信界面添加客户(企业微信界面UI框架不支持任何自动化技术,通过上述实施例所述的图像匹配方法,企业微信可以像其他支持自动化技术的软件一样被捕获和操控)以及基于业务视频开发自动化流程(业务人员录制自己在电脑上操作业务***的视频,开发者可以直接通过这个视频捕获界面元素开发流程)。
S240、基于CSS选择器匹配目标图像中的候选关键元素。
本发明实施例的技术方案,基于元素选择指令所确定的目标关键元素,并基于目标关键元素的元素特征生成对应的CSS选择器,保证了所生成的CSS选择器的准确性,以及CSS选择器与目标关键元素之间的唯一性,为后续匹配目标图像中的候选关键元素奠定了基础。
实施例三
图3为本发明实施例三提供的一种图像匹配装置的结构示意图。如图3所示,该装置包括:
元素树构建模块310,用于从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于候选关键元素和候选关键元素的位置信息为目标图像构建元素树;
选择器生成模块320,用于响应于元素选择指令从元素树中确定目标关键元素,并为目标关键元素生成CSS选择器;
编辑模块330,用于基于CSS选择器匹配目标图像中的候选关键元素。
本发明实施例的技术方案,基于目标图像中所识别到的候选关键元素和候选关键元素的位置信息构建目标图像对应的元素树,通过从元素树中确定目标关键元素,并为目标关键元素生成CSS选择器,基于CSS选择器匹配目标图像中的候选关键元素,提高了图像匹配的准确性以及匹配效率。
可选的,选择器生成模块320,包括:
目标关键元素确定单元,用于响应于元素选择指令,在目标图像的至少两个候选关键元素中确定目标关键元素;
选择器生成单元,用于针对目标关键元素,根据目标关键元素的元素特征为目标关键元素生成CSS选择器。
可选的,选择器生成单元可具体用于:根据目标关键元素的元素特征和目标关键元素在元素树所处的节点信息生成CSS选择器中的标识字段;基于CSS选择器中的标识字段确定目标关键元素所对应的CSS选择器。
可选的,元素树构建模块310,包括:
第一识别单元,用于基于边缘检测算法,对目标图像进行图像分割,识别出目标图像中的至少两个候选关键元素和候选关键元素的位置信息;
第一过滤单元,用于基于预设的过滤连接组件,对至少两个候选关键元素进行筛选,将筛选后的候选关键元素用于构建元素树;其中,过滤连接组件根据候选关键元素的位置信息确定。
可选的,元素树构建模块310,包括:
第二识别单元,用于基于预先训练好的图片识别模型,对目标图像中的候选关键元素进行识别;
第二过滤单元,用于基于候选关键元素的位置信息,对所识别到的至少两个候选关键元素进行筛选;
构建单元,用于将筛选后的候选关键元素用于构建元素树。
可选的,编辑模块330可具体用于:基于选择器标识,确定出选择器标识对应的CSS选择器;通过CSS选择器,从目标图像中匹配CSS选择器所对应的候选关键元素。
可选的,元素特征用于表征候选关键元素的图像信息,包括候选关键元素的图像类型信息、图像文本信息以及图像位置信息中的至少一种。
本发明实施例所提供的图像匹配装置可执行本发明任意实施例所提供的图像匹配方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4示出了可以用来实施本发明的实施例的电子设备410的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备410包括至少一个处理器411,以及与至少一个处理器411通信连接的存储器,如只读存储器(ROM)412、随机访问存储器(RAM)413等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器411可以根据存储在只读存储器(ROM)412中的计算机程序或者从存储单元418加载到随机访问存储器(RAM)413中的计算机程序,来执行各种适当的动作和处理。在RAM 413中,还可存储电子设备410操作所需的各种程序和数据。处理器411、ROM 412以及RAM 413通过总线414彼此相连。输入/输出(I/O)接口415也连接至总线414。
电子设备410中的多个部件连接至I/O接口415,包括:输入单元416,例如键盘、鼠标等;输出单元417,例如各种类型的显示器、扬声器等;存储单元418,例如磁盘、光盘等;以及通信单元419,例如网卡、调制解调器、无线通信收发机等。通信单元419允许电子设备410通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器411可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器411的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器411执行上文所描述的各个方法和处理,例如图像匹配方法。
在一些实施例中,图像匹配方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元418。在一些实施例中,计算机程序的部分或者全部可以经由ROM 412和/或通信单元419而被载入和/或安装到电子设备410上。当计算机程序加载到RAM 413并由处理器411执行时,可以执行上文描述的图像匹配方法的一个或多个步骤。备选地,在其他实施例中,处理器411可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像匹配方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的***和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种图像匹配方法,其特征在于,包括:
从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于所述候选关键元素和候选关键元素的位置信息为所述目标图像构建元素树;
响应于元素选择指令从所述元素树中确定目标关键元素,并为所述目标关键元素生成CSS选择器;
基于所述CSS选择器匹配所述目标图像中的候选关键元素。
2.根据权利要求1所述的方法,其特征在于,所述响应于元素选择指令从所述元素树中确定目标关键元素,并为所述目标关键元素生成CSS选择器,包括:
响应于元素选择指令,在所述目标图像的至少两个候选关键元素中确定目标关键元素;
针对所述目标关键元素,根据所述目标关键元素的元素特征为所述目标关键元素生成CSS选择器。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标关键元素的元素特征为所述目标关键元素生成CSS选择器,包括:
根据所述目标关键元素的元素特征和所述目标关键元素在所述元素树所处的节点信息生成CSS选择器中的标识字段;
基于CSS选择器中的标识字段确定目标关键元素所对应的CSS选择器。
4.根据权利要求1所述的方法,其特征在于,所述从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于所述候选关键元素和候选关键元素的位置信息为所述目标图像构建元素树,包括:
基于边缘检测算法,对目标图像进行图像分割,识别出目标图像中的至少两个候选关键元素和候选关键元素的位置信息;
基于预设的过滤连接组件,对所述至少两个候选关键元素进行筛选,将筛选后的候选关键元素用于构建元素树;其中,所述过滤连接组件根据所述候选关键元素的位置信息确定。
5.根据权利要求1所述的方法,其特征在于,所述从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于所述候选关键元素和候选关键元素的位置信息为所述目标图像构建元素树,包括:
基于预先训练好的图片识别模型,对目标图像中的候选关键元素进行识别;
基于所述候选关键元素的位置信息,对所识别到的至少两个候选关键元素进行筛选;
将筛选后的候选关键元素用于构建元素树。
6.根据权利要求1所述的方法,其特征在于,所述CSS选择器有唯一确定的选择器标识;相应的,基于所述CSS选择器匹配所述目标图像中的候选关键元素,包括:
基于选择器标识,确定出所述选择器标识对应的CSS选择器;
通过所述CSS选择器,从所述目标图像中匹配所述CSS选择器所对应的候选关键元素。
7.根据权利要求2所述的方法,其特征在于,所述元素特征用于表征候选关键元素的图像信息,包括候选关键元素的图像类型信息、图像文本信息以及图像位置信息中的至少一种。
8.一种图像匹配装置,其特征在于,包括:
元素树构建模块,用于从目标图像中识别候选关键元素和候选关键元素的位置信息,并基于所述候选关键元素和候选关键元素的位置信息为所述目标图像构建元素树;
选择器生成模块,用于响应于元素选择指令从所述元素树中确定目标关键元素,并为所述目标关键元素生成CSS选择器;
编辑模块,用于基于所述CSS选择器匹配所述目标图像中的候选关键元素。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的图像匹配方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的图像匹配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410188202.7A CN117830666A (zh) | 2024-02-20 | 2024-02-20 | 一种图像匹配方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410188202.7A CN117830666A (zh) | 2024-02-20 | 2024-02-20 | 一种图像匹配方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117830666A true CN117830666A (zh) | 2024-04-05 |
Family
ID=90515723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410188202.7A Pending CN117830666A (zh) | 2024-02-20 | 2024-02-20 | 一种图像匹配方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117830666A (zh) |
-
2024
- 2024-02-20 CN CN202410188202.7A patent/CN117830666A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020140698A1 (zh) | 表格数据的获取方法、装置和服务器 | |
CN114550177A (zh) | 图像处理的方法、文本识别方法及装置 | |
JP7389824B2 (ja) | オブジェクト識別方法と装置、電子機器及び記憶媒体 | |
CN115861400A (zh) | 目标对象检测方法、训练方法、装置以及电子设备 | |
CN114494751A (zh) | 证照信息识别方法、装置、设备及介质 | |
CN114596188A (zh) | 水印检测方法、模型训练方法、装置及电子设备 | |
CN112883827A (zh) | 图像中指定目标的识别方法、装置、电子设备和存储介质 | |
CN115905016A (zh) | 一种BIOS Setup搜索功能测试方法、装置、电子设备及存储介质 | |
CN117830666A (zh) | 一种图像匹配方法、装置、设备及介质 | |
CN114998906B (zh) | 文本检测方法、模型的训练方法、装置、电子设备及介质 | |
CN112988011B (zh) | 取词翻译方法和装置 | |
CN115205555B (zh) | 确定相似图像的方法、训练方法、信息确定方法及设备 | |
CN116431698B (zh) | 一种数据提取方法、装置、设备及存储介质 | |
CN116258769B (zh) | 一种定位校验方法、装置、电子设备和存储介质 | |
CN116186549B (zh) | 模型的训练方法、装置、设备和介质 | |
CN116363260B (zh) | 图像生成方法、装置及电子设备 | |
CN114741072B (zh) | 一种页面生成方法、装置、设备及存储介质 | |
CN112101368B (zh) | 一种字符图像处理方法、装置、设备和介质 | |
CN118151804A (zh) | 一种大屏自动布局方法、装置、设备及存储介质 | |
CN117033463A (zh) | 基于视频日志的优化策略生成方法、装置、设备及介质 | |
CN117671711A (zh) | 凭证识别模型的更新构建方法、装置、设备及介质 | |
CN117275006A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN118277143A (zh) | 一种输入设备的端口异常修复方法、装置、设备及介质 | |
CN115934567A (zh) | 一种界面控件检测识别方法、装置、电子设备及存储介质 | |
CN116302987A (zh) | 一种目标区域的处理方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |