CN116645418A - 基于2d和3d相机的屏幕按钮检测方法、装置及其相关介质 - Google Patents

基于2d和3d相机的屏幕按钮检测方法、装置及其相关介质 Download PDF

Info

Publication number
CN116645418A
CN116645418A CN202310624939.4A CN202310624939A CN116645418A CN 116645418 A CN116645418 A CN 116645418A CN 202310624939 A CN202310624939 A CN 202310624939A CN 116645418 A CN116645418 A CN 116645418A
Authority
CN
China
Prior art keywords
data
button
image
image data
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310624939.4A
Other languages
English (en)
Inventor
丁克
丁兢
淳豪
李翔
马洁
王丰
叶闯
庞旭芳
林锦辉
胡财荣
刘芊伟
陆俊君
张敏
王凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Xianyang Technology Co ltd
Original Assignee
Foshan Xianyang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Xianyang Technology Co ltd filed Critical Foshan Xianyang Technology Co ltd
Priority to CN202310624939.4A priority Critical patent/CN116645418A/zh
Publication of CN116645418A publication Critical patent/CN116645418A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了基于2D和3D相机的屏幕按钮检测方法、装置及其相关介质,该方法包括分别获取2D图像数据和3D图像数据并建立空间映射关系,得到图像映射结果;对所述图像映射结果进行图像预处理,得到预处理结果;根据所述预处理结果进行图像数据匹配和模型重建处理,得到3D屏幕模型;根据预设的按钮参数提取所述3D屏幕模型的按钮区域数据,得到3D按钮数据;采集2D按钮数据,并将所述2D按钮数据与所述3D按钮数据进行特征点匹配,得到最终的按钮数据。本发明利用2D图像数据和3D图像数据建立3D屏幕模型,并从3D屏幕模型获取3D按钮数据,将3D按钮数据与2D按钮数据匹配,得到最终的按钮数据,如此,提高了屏幕按钮检测的精度和稳定性。

Description

基于2D和3D相机的屏幕按钮检测方法、装置及其相关介质
技术领域
本发明涉及数据检测技术领域,特别涉及基于2D和3D相机的屏幕按钮检测方法、装置及其相关介质。
背景技术
在现有技术中,屏幕按钮检测方法是广泛应用的一种技术,特别是在触摸屏设备应用中。传统的屏幕按钮检测方法通常依赖于2D图像数据,即通过分析平面图像来检测按钮的位置和状态;然而,这种方法可能存在一些限制,例如对于具有透视效果或复杂的三维形状的按钮,准确性和稳定性可能会受到影响。在检测范围大、检测距离短的工况中,现有的屏幕按钮检测方法无法获得屏幕完整的三维数据,屏幕按钮的检测精度和稳定性大大降低。
发明内容
本发明实施例提供了基于2D和3D相机的屏幕按钮检测方法、装置及其相关介质,旨在解决现有技术中由于单一相机的视野受限,导致屏幕按钮检测的精度和稳定性降低的问题。
第一方面,本发明实施例提供了一种基于2D和3D相机的屏幕按钮检测方法,包括:
分别获取2D图像数据和3D图像数据,并利用所述2D图像数据和3D图像数据建立空间映射关系,得到图像映射结果;
对所述图像映射结果进行图像预处理,得到预处理结果;其中,所述预处理结果包括所述2D图像数据和3D图像数据的预处理结果;
根据所述预处理结果进行图像数据匹配和模型重建处理,得到3D屏幕模型;
根据预设的按钮参数提取所述3D屏幕模型的按钮区域数据,得到3D按钮数据;
采集2D按钮数据,并将所述2D按钮数据与所述3D按钮数据进行特征点匹配,得到最终的按钮数据;其中,所述按钮数据用于上传到检测***。
第二方面,本发明实施例提供了一种基于2D和3D相机的屏幕按钮检测装置,包括:
图像映射单元,用于分别获取2D图像数据和3D图像数据,并利用所述2D图像数据和3D图像数据建立空间映射关系,得到图像映射结果;
图像处理单元,用于对所述图像映射结果进行图像预处理,得到预处理结果;其中,所述预处理结果包括所述2D图像数据和3D图像数据的预处理结果;
图像重建单元,用于根据所述预处理结果进行图像数据匹配和模型重建处理,得到3D屏幕模型;
图像提取单元,用于根据预设的按钮参数提取所述3D屏幕模型的按钮区域数据,得到3D按钮数据;
图像匹配单元,用于采集2D按钮数据,并将所述2D按钮数据与所述3D按钮数据进行特征点匹配,得到最终的按钮数据;其中,所述按钮数据用于上传到检测***。
第三方面,本发明实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述第一方面的基于2D和3D相机的屏幕按钮检测方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述第一方面的基于2D和3D相机的屏幕按钮检测方法。
本发明实施例提供一种基于2D和3D相机的屏幕按钮检测方法,包括分别获取2D图像数据和3D图像数据并建立空间映射关系,得到图像映射结果;对所述图像映射结果进行图像预处理,得到预处理结果;根据所述预处理结果进行图像数据匹配和模型重建处理,得到3D屏幕模型;根据预设的按钮参数提取所述3D屏幕模型的按钮区域数据,得到3D按钮数据;采集2D按钮数据,并将所述2D按钮数据与所述3D按钮数据进行特征点匹配,得到最终的按钮数据。本发明利用2D图像数据和3D图像数据建立3D屏幕模型,并从3D屏幕模型获取3D按钮数据,将3D按钮数据与2D按钮数据匹配,得到最终的按钮数据,如此,提高了屏幕按钮检测的精度和稳定性。
本发明实施例还提供一种基于2D和3D相机的屏幕按钮检测装置、计算机设备和存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于2D和3D相机的屏幕按钮检测方法的流程示意图;
图2本发明实施例提供的一种基于2D和3D相机的屏幕按钮检测方法的另一流程示意图;
图3为本发明实施例提供的一种基于2D和3D相机的屏幕按钮检测装置的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
下面请参见图1,图1为本发明实施例提供的一种基于2D和3D相机的屏幕按钮检测方法的流程示意图,具体包括:步骤S101~S105。
S101、分别获取2D图像数据和3D图像数据,并利用所述2D图像数据和3D图像数据建立空间映射关系,得到图像映射结果;
S102、对所述图像映射结果进行图像预处理,得到预处理结果;其中,所述预处理结果包括所述2D图像数据和3D图像数据的预处理结果;
S103、根据所述预处理结果进行图像数据匹配和模型重建处理,得到3D屏幕模型;
S104、根据预设的按钮参数提取所述3D屏幕模型的按钮区域数据,得到3D按钮数据;
S105、采集2D按钮数据,并将所述2D按钮数据与所述3D按钮数据进行特征点匹配,得到最终的按钮数据;其中,所述按钮数据用于上传到检测***。
结合图2所示,在步骤S101中,使用相机采集2D图像数据和3D图像数据,2D图像数据包括图像的颜色和纹理信息,3D图像数据包括物体的几何形状和深度信息;将2D图像数据和3D图像数据导入***的映射建模模块,映射建模模块根据2D图像数据和3D图像数据的特征建立空间映射关系,得到图像映射结果。
具体的,将2D图像数据中的像素点映射到3D图像数据中的对应点,映射关系可以通过相机的内部参数(如焦距、主点位置)和外部参数(如相机的位置和朝向)来建立,映射关系的建立可以将2D图像数据中的像素坐标转换为真实世界中的三维坐标。
在一实施例中,所述步骤S101之前,包括:
选定相机的标定板并对所述标定板分别进行光照均匀性优化和背景噪声最小化处理,得到标定板定位参数;利用角点检测算法对所述标定板定位参数进行角点检测,得到标定板角点参数;利用非线性优化算法对相机的内参进行估计,得到内参标定数值;利用三维重建算法对相机的外参进行估计,得到外参标定数值;采用加项式畸变校正分别对所述内参标定数值和所述外参标定数值进行径向畸变以及切向畸变处理,得到畸变校正数值;其中,所述畸变校正数值用于获取所述2D图像数据和3D图像数。
在本实施例中,根据标定需求选择合适的标定板,使用精确的定位装置将标定板精确定位于空间中,确保被观测物体的不同位置和角度都能够被完整地观测到,并在布置过程中考虑光照均匀性优化和背景噪声的最小化。对于光照均匀性优化,可以确保光源的均匀性和稳定性,避免阴影和强烈的光照变化,使用均匀光源,如漫射光源或光箱,并根据需要调整光源的位置和强度,并尽量减少杂散光和反射。对于背景噪声的最小化,可以采集多个图像帧,并进行平均处理,这有助于减少由于随机噪声引起的图像变动,提高图像质量和稳定性。采用精密的角点检测算法,如基于图像梯度的Shi-Tomasi算法、基于机器学习的卷积神经网络等,以高精度和高稳定性地检测标定板上的角点,得到标定板角点参数;利用非线性优化算法(例如Gauss-Newton或Levenberg-Marquardt)或基于贝叶斯推理的方法,对相机的内部参数进行估计,可以得到内参标定数值;利用三维重建算法,如基于多视图几何关系的BundleAdjustment、Structure-from-Motion等,得到外参标定数值(如相机的位置、姿态和尺度信息);采用精确的畸变校正方法,如多项式畸变校正、光学模型拟合等,以准确消除图像中的径向畸变和切向畸变,处理完成后即可得到畸变校正数值。
在一实施例中,所述步骤S101,包括:
利用高动态范围算法分别捕获所述2D图像数据的坐标数值和所述3D图像数据的坐标数值;将所述2D图像数据的坐标数值进行归一化处理,得到归一化坐标数值;将所述归一化坐标数值与所述3D图像数据的坐标数值进行匹配,得到所述图像映射结果。
在本实施例中,确保光线充足以及噪声最小化的情况下,采用高动态范围算法来以捕获所述2D图像数据的坐标数值和所述3D图像数据的坐标数值。高动态范围(HighDynamicRange,HDR)算法是一种用于合成具有广泛亮度范围的图像的技术;它通过将多个不同曝光程度的图像合成为一张综合图像,以展现比标准图像所能捕捉到的更大动态范围,如曝光融合算法、ToneMapping算法、图像对齐算法等。另外,常见的归一化方法包括将坐标值除以图像的宽度和高度,使其范围在0到1之间;将2D图像数据的归一化坐标数值与3D图像数据中的坐标数值进行匹配,通过选定的匹配算法来实现,如最近邻匹配、最小二乘法拟合等,匹配的目的是将2D图像数据中的坐标与对应的3D图像数据中的坐标进行关联,建立空间映射关系,可以利用这个映射关系,对2D图像数据中的像素进行3D坐标的推测或反向投影,从而实现2D与3D之间的关联。
在步骤S102中,对图像映射结果中的2D图像数据进行预处理,目的是提取和增强图像中的有用信息;对图像映射结果中的3D图像数据进行预处理,目的是优化3D图像数据,以便进一步的分析和应用;预处理结果的质量和准确性直接影响后续的图像处理和相关应用的效果。
在一实施例中,所述步骤S102,包括:
对所述图像映射结果进行中值滤波以及直方图均匀化,以获取第一干预数据;对所述第一处理数据进行尺寸调整以及图像配准,以获取第二干预数据;利用去除伪影算法对所述第二干预数据进行干扰排除,得到所述预处理结果。
在本实施例中,中值滤波可以有效降低图像中的噪声,并保留边缘信息;直方图均匀化可以增强图像的对比度和细节,使图像更加清晰;对第一干预数据进行尺寸调整和图像配准处理,以获取第二干预数据,尺寸调整可以将图像调整为所需的尺寸,可以根据实际需求进行调整;图像配准可以将不同图像之间的位置和角度进行校准,以使它们在空间上对齐,便于后续的处理;利用去除伪影算法对第二干预数据进行干扰排除,得到预处理结果,去除伪影算法可以识别和去除图像中的干扰信号,如伪影、光晕等,通过排除这些干扰,可以得到更准确和清晰的预处理结果。
在步骤S103中,图像数据匹配的目的是将预处理后的2D图像数据和3D图像数据在空间上对齐,为后续的模型重建提供准确的数据基础,基于图像数据匹配结果,进行模型重建处理,根据2D图像数据和对应的3D图像数据,使用三维重建算法和技术进行模型重建,包括点云重建、表面重建、体素重建等方法,最终得到3D屏幕模型,该3D屏幕模型表示屏幕的三维形状和结构,可以用于后续的可视化、分析和应用。
在一实施例中,所述步骤S103,包括:
利用特征提取算法提取所述预处理结果的特征点并进行图像数据匹配,得到特征点匹配结果;根据所述特征点匹配结果进行基础矩阵估计以及三角化处理,得到多个三维点数据;利用所述三维点数据建立稠密点云,并对所述稠密点云进行滤波优化,得到点云滤波结果;对所述点云滤波结果进行表面重建以生成表面网络模型,并对所述表面网络模型进行细化处理,得到所述3D屏幕模型;其中,所述细化处理包括平滑、修复孔洞、纹理映射和细分。
在本实施例中,特征点的提取可以使用常见的特征提取算法,如SIFT、SURF、ORB等,然后通过匹配提取到的特征点,建立图像间的对应关系,得到特征点匹配结果;根据特征点匹配结果,进行基础矩阵估计和三角化处理,基础矩阵估计可以推断出图像间的相机运动关系,用于后续的三维点云重建;三角化处理可以通过匹配的特征点坐标,计算出对应的三维点数据;利用多个三维点数据,建立稠密点云,对稠密点云进行滤波优化,以去除噪声和无效点,得到点云滤波结果,点云滤波可以采用滤波算法,如高斯滤波、统计滤波等,以提高点云的质量和准确性;通过表面重建可以生成表示物体或场景的表面网格模型,表面重建方法包括基于几何的方法(如泊松重建、MarchingCubes等);对表面网络模型进行细化处理,包括平滑、修复孔洞、纹理映射和细分等操作,以得到更精细和真实的3D屏幕模型。
在步骤S104中,预先设定按钮的参数,包括按钮的位置、大小、形状等信息。这些参数可以通过人工标注或者自动检测算法得到;根据预设的按钮参数,从3D屏幕模型中提取按钮区域数据,根据按钮的位置和大小,可以在3D屏幕模型中定义一个体积或区域,用于表示按钮的范围,通过对3D模型进行几何形状切割,提取按钮区域数据,通过按钮区域提取,得到3D按钮数据。
在一实施例中,所述步骤S104,包括:
根据所述按钮参数对所述3D屏幕模型进行区域筛选,得到区域筛选结果;利用区域分割算法将所述区域筛选结果从所述3D屏幕模型中分割并提取,得到区域提取结果;对所述区域提取结果进行重采样和插值处理,得到所述3D按钮数据。
在本实施例中,根据按钮的位置、大小和形状等参数,可以定义一个区域或体积来表示按钮的范围,通过区域筛选保留符合按钮参数的区域,得到区域筛选结果;利用区域分割算法,将区域筛选结果从3D屏幕模型中分割并提取出来,区域分割算法可以基于几何形状进行,将符合按钮参数的区域从模型中分离出来,得到区域提取结果;对区域提取结果进行重采样和插值处理,以获取更精细和平滑的3D按钮数据,重采样可以调整数据的采样率或密度,以满足用户需求,插值可以填补数据中的空缺或缺失,使数据更加完整和连续。通过重采样和插值处理,可以得到最终的3D按钮数据。
在步骤S105中,通过相机采集2D按钮数据,将相机对准屏幕上的按钮,并拍摄按钮的图像。可以采用不同角度和光照条件下的多个图像,将2D按钮数据中的特征点与3D按钮数据中的特征点进行匹配。可以使用特征点匹配算法(如FLANN、RANSAC等)进行匹配;根据特征点匹配的结果,将2D按钮数据和3D按钮数据相对应的按钮信息进行关联,得到最终的按钮数据;按钮数据包括按钮的位置、大小、形状、颜色等信息,最终按钮数据可以作为上传到检测***的输入,用于进行按钮的检测和识别。
在一实施例中,所述步骤S105,包括:
提取所述2D按钮数据与所述3D按钮数据的特征点,以生成特征描述子;计算不同所述特征描述子中具有相似特征的得分,并将得分邻近的所述特征描述子进行匹配候选,得到匹配候选数据;对所述匹配候选数据进行相似性度量以及指标评估,得到所述最终的按钮数据;其中,所述最终的按钮数据包括屏幕按钮的位置信息和深度信息。
在本实施例中,利用特征提取算法(如SURF、PPF算法等),从2D按钮数据和3D按钮数据中提取特征点,并生成特征描述子;特征点表示按钮的显著特征,描述子描述了特征点周围区域的特征;计算不同特征描述子之间的相似性得分,将得分邻近的特征描述子作为匹配候选数据,可以使用相似性度量方法如欧氏距离、余弦相似度等来计算特征描述子之间的相似性得分,得分邻近的特征描述子表示它们具有相似的特征;对匹配候选数据进行相似性度量和指标评估,以获取最终的按钮数据,相似性度量可以通过计算匹配候选数据之间的相似性分数,如基于距离的相似性度量,指标评估可以使用各种评估指标,如精度、召回率、F1分数等来评估匹配候选数据的质量;最终的按钮数据可以包括屏幕按钮的位置信息和深度信息,提供了按钮的准确位置和距离信息。
综上所述,本发明可以应用于各种屏幕检测场景,例如电子产品制造、仓库物流等,且无需对屏幕进行接触式检测,避免了屏幕受损和影响检测结果的可能性。另外,本发明采用多个2D相机和3D相机融合的方式,可以获取更加全面和准确的屏幕图像,从而提高了检测精度,在一定程度上降低单个相机出现故障的风险。
结合图3所示,图3为本发明实施例提供的一种基于2D和3D相机的屏幕按钮检测装置的示意性框图,基于2D和3D相机的屏幕按钮检测装置300包括:
图像映射单元301,用于分别获取2D图像数据和3D图像数据,并利用所述2D图像数据和3D图像数据建立空间映射关系,得到图像映射结果;
图像处理单元302,用于对所述图像映射结果进行图像预处理,得到预处理结果;其中,所述预处理结果包括所述2D图像数据和3D图像数据的预处理结果;
图像重建单元303,用于根据所述预处理结果进行图像数据匹配和模型重建处理,得到3D屏幕模型;
图像提取单元304,用于根据预设的按钮参数提取所述3D屏幕模型的按钮区域数据,得到3D按钮数据;
图像匹配单元305,用于采集2D按钮数据,并将所述2D按钮数据与所述3D按钮数据进行特征点匹配,得到最终的按钮数据;其中,所述按钮数据用于上传到检测***。
在本实施例中,图像映射单元301分别获取2D图像数据和3D图像数据,并利用所述2D图像数据和3D图像数据建立空间映射关系,得到图像映射结果;图像处理单元302对所述图像映射结果进行图像预处理,得到预处理结果;其中,所述预处理结果包括所述2D图像数据和3D图像数据的预处理结果;图像重建单元303根据所述预处理结果进行图像数据匹配和模型重建处理,得到3D屏幕模型;图像提取单元304根据预设的按钮参数提取所述3D屏幕模型的按钮区域数据,得到3D按钮数据;图像匹配单元305采集2D按钮数据,并将所述2D按钮数据与所述3D按钮数据进行特征点匹配,得到最终的按钮数据;其中,所述按钮数据用于上传到检测***。
在一实施例中,所述图像映射单元301之前,包括:
标定单元,用于选定相机的标定板并对所述标定板分别进行光照均匀性优化和背景噪声最小化处理,得到标定板定位参数;
检测单元,用于利用角点检测算法对所述标定板定位参数进行角点检测,得到标定板角点参数;
内参单元,用于利用非线性优化算法对相机的内参进行估计,得到内参标定数值;
外参单元,用于利用三维重建算法对相机的外参进行估计,得到外参标定数值;
畸变单元,用于采用加项式畸变校正分别对所述内参标定数值和所述外参标定数值进行径向畸变以及切向畸变处理,得到畸变校正数值;其中,所述畸变校正数值用于获取所述2D图像数据和3D图像数。
在一实施例中,所述图像映射单元301,包括:
动态单元,用于利用高动态范围算法分别捕获所述2D图像数据的坐标数值和所述3D图像数据的坐标数值;
归一单元,用于将所述2D图像数据的坐标数值进行归一化处理,得到归一化坐标数值;
映射单元,用于将所述归一化坐标数值与所述3D图像数据的坐标数值进行匹配,得到所述图像映射结果。
在一实施例中,所述图像处理单元302,包括:
直方单元,用于对所述图像映射结果进行中值滤波以及直方图均匀化,以获取第一干预数据;
干预单元,用于对所述第一处理数据进行尺寸调整以及图像配准,以获取第二干预数据;
伪影单元,用于利用去除伪影算法对所述第二干预数据进行干扰排除,得到所述预处理结果。
在一实施例中,所述图像重建单元303,包括:
匹配单元,用于利用特征提取算法所述预处理结果的特征点并进行图像数据匹配,得到特征点匹配结果;
三角单元,用于根据所述特征点匹配结果进行基础矩阵估计以及三角化处理,得到多个三维点数据;
滤波单元,用于利用所述三维点数据建立稠密点云,并对所述稠密点云进行滤波优化,得到点云滤波结果;
修复单元,用于对所述点云滤波结果进行表面重建以生成表面网络模型,并对所述表面网络模型进行细化处理,得到所述3D屏幕模型;其中,所述细化处理包括平滑、修复孔洞、纹理映射和细分。
在一实施例中,所述图像提取单元304,包括:
筛选单元,用于根据所述按钮参数对所述3D屏幕模型进行区域筛选,得到区域筛选结果;
提取单元,用于利用区域分割算法将所述区域筛选结果从所述3D屏幕模型中分割并提取,得到区域提取结果;
插值单元,用于对所述区域提取结果进行重采样和插值处理,得到所述3D按钮数据。
在一实施例中,所述图像匹配单元305,包括:
特征单元,用于提取所述2D按钮数据与所述3D按钮数据的特征点,以生成特征描述子;
候选单元,用于计算不同所述特征描述子中具有相似特征的得分,并将得分邻近的所述特征描述子进行匹配候选,得到匹配候选数据;
指标单元,用于对所述匹配候选数据进行相似性度量以及指标评估,得到所述最终的按钮数据;其中,所述最终的按钮数据包括屏幕按钮的位置信息和深度信息。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本发明实施例还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供了一种计算机设备,可以包括存储器和处理器,存储器中存有计算机程序,处理器调用存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然计算机设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种基于2D和3D相机的屏幕按钮检测方法,其特征在于,包括:
分别获取2D图像数据和3D图像数据,并利用所述2D图像数据和3D图像数据建立空间映射关系,得到图像映射结果;
对所述图像映射结果进行图像预处理,得到预处理结果;其中,所述预处理结果包括所述2D图像数据和3D图像数据的预处理结果;
根据所述预处理结果进行图像数据匹配和模型重建处理,得到3D屏幕模型;
根据预设的按钮参数提取所述3D屏幕模型的按钮区域数据,得到3D按钮数据;
采集2D按钮数据,并将所述2D按钮数据与所述3D按钮数据进行特征点匹配,得到最终的按钮数据;其中,所述按钮数据用于上传到检测***。
2.根据权利要求1所述的基于2D和3D相机的屏幕按钮检测方法,其特征在于,所述分别获取2D图像数据和3D图像数据,并利用所述2D图像数据和3D图像数据建立空间映射关系,得到图像映射结果之前,包括:
选定相机的标定板并对所述标定板分别进行光照均匀性优化和背景噪声最小化处理,得到标定板定位参数;
利用角点检测算法对所述标定板定位参数进行角点检测,得到标定板角点参数;
利用非线性优化算法对相机的内参进行估计,得到内参标定数值;
利用三维重建算法对相机的外参进行估计,得到外参标定数值;
采用加项式畸变校正分别对所述内参标定数值和所述外参标定数值进行径向畸变以及切向畸变处理,得到畸变校正数值;其中,所述畸变校正数值用于获取所述2D图像数据和3D图像数。
3.根据权利要求1所述的基于2D和3D相机的屏幕按钮检测方法,其特征在于,所述分别获取2D图像数据和3D图像数据,并利用所述2D图像数据和3D图像数据建立空间映射关系,得到图像映射结果,包括:
利用高动态范围算法分别捕获所述2D图像数据的坐标数值和所述3D图像数据的坐标数值;
将所述2D图像数据的坐标数值进行归一化处理,得到归一化坐标数值;
将所述归一化坐标数值与所述3D图像数据的坐标数值进行匹配,得到所述图像映射结果。
4.根据权利要求1所述的基于2D和3D相机的屏幕按钮检测方法,其特征在于,所述对所述图像映射结果进行图像预处理,得到预处理结果,包括:
对所述图像映射结果进行中值滤波以及直方图均匀化,以获取第一干预数据;
对所述第一处理数据进行尺寸调整以及图像配准,以获取第二干预数据;
利用去除伪影算法对所述第二干预数据进行干扰排除,得到所述预处理结果。
5.根据权利要求1所述的基于2D和3D相机的屏幕按钮检测方法,其特征在于,所述根据所述预处理结果进行图像数据匹配和模型重建处理,得到3D屏幕模型,包括:
利用特征提取算法提取所述预处理结果的特征点并进行图像数据匹配,得到特征点匹配结果;
根据所述特征点匹配结果进行基础矩阵估计以及三角化处理,得到多个三维点数据;
利用所述三维点数据建立稠密点云,并对所述稠密点云进行滤波优化,得到点云滤波结果;
对所述点云滤波结果进行表面重建以生成表面网络模型,并对所述表面网络模型进行细化处理,得到所述3D屏幕模型;其中,所述细化处理包括平滑、修复孔洞、纹理映射和细分。
6.根据权利要求1所述的基于2D和3D相机的屏幕按钮检测方法,其特征在于,所述根据预设的按钮参数提取所述3D屏幕模型的按钮区域数据,得到3D按钮数据,包括:
根据所述按钮参数对所述3D屏幕模型进行区域筛选,得到区域筛选结果;
利用区域分割算法将所述区域筛选结果从所述3D屏幕模型中分割并提取,得到区域提取结果;
对所述区域提取结果进行重采样和插值处理,得到所述3D按钮数据。
7.根据权利要求1所述的基于2D和3D相机的屏幕按钮检测方法,其特征在于,所述采集2D按钮数据,并将所述2D按钮数据与所述3D按钮数据进行特征点匹配,得到最终的按钮数据,包括:
提取所述2D按钮数据与所述3D按钮数据的特征点,以生成特征描述子;
计算不同所述特征描述子中具有相似特征的得分,并将得分邻近的所述特征描述子进行匹配候选,得到匹配候选数据;
对所述匹配候选数据进行相似性度量以及指标评估,得到所述最终的按钮数据;其中,所述最终的按钮数据包括屏幕按钮的位置信息和深度信息。
8.一种基于2D和3D相机的屏幕按钮检测装置,其特征在于,包括:
图像映射单元,用于分别获取2D图像数据和3D图像数据,并利用所述2D图像数据和3D图像数据建立空间映射关系,得到图像映射结果;
图像处理单元,用于对所述图像映射结果进行图像预处理,得到预处理结果;其中,所述预处理结果包括所述2D图像数据和3D图像数据的预处理结果;
图像重建单元,用于根据所述预处理结果进行图像数据匹配和模型重建处理,得到3D屏幕模型;
图像提取单元,用于根据预设的按钮参数提取所述3D屏幕模型的按钮区域数据,得到3D按钮数据;
图像匹配单元,用于采集2D按钮数据,并将所述2D按钮数据与所述3D按钮数据进行特征点匹配,得到最终的按钮数据;其中,所述按钮数据用于上传到检测***。
9.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于2D和3D相机的屏幕按钮检测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于2D和3D相机的屏幕按钮检测方法。
CN202310624939.4A 2023-05-30 2023-05-30 基于2d和3d相机的屏幕按钮检测方法、装置及其相关介质 Pending CN116645418A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310624939.4A CN116645418A (zh) 2023-05-30 2023-05-30 基于2d和3d相机的屏幕按钮检测方法、装置及其相关介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310624939.4A CN116645418A (zh) 2023-05-30 2023-05-30 基于2d和3d相机的屏幕按钮检测方法、装置及其相关介质

Publications (1)

Publication Number Publication Date
CN116645418A true CN116645418A (zh) 2023-08-25

Family

ID=87618434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310624939.4A Pending CN116645418A (zh) 2023-05-30 2023-05-30 基于2d和3d相机的屏幕按钮检测方法、装置及其相关介质

Country Status (1)

Country Link
CN (1) CN116645418A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118096742A (zh) * 2024-04-23 2024-05-28 鑫创鑫自动化设备科技(漳州)有限公司 一种基于角点检测和三维建模技术的贴片机吸嘴检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118096742A (zh) * 2024-04-23 2024-05-28 鑫创鑫自动化设备科技(漳州)有限公司 一种基于角点检测和三维建模技术的贴片机吸嘴检测方法

Similar Documents

Publication Publication Date Title
CN110363858B (zh) 一种三维人脸重建方法及***
CN106709950B (zh) 一种基于双目视觉的巡线机器人跨越障碍导线定位方法
WO2014044126A1 (zh) 坐标获取装置、实时三维重建***和方法、立体交互设备
CN112200854B (zh) 一种基于视频图像的叶类蔬菜三维表型测量方法
CN116645418A (zh) 基于2d和3d相机的屏幕按钮检测方法、装置及其相关介质
CN114998328A (zh) 一种基于机器视觉的工件喷涂缺陷检测方法、***及可读存储介质
CN108510544A (zh) 一种基于特征聚类的光条定位方法
CN112833821B (zh) 高密度ic焊点的微分几何立体微视觉检测***及方法
CN116977341B (zh) 一种尺寸测量方法及相关装置
CN115108466A (zh) 一种集装箱吊具智能定位的方法
CN116596987A (zh) 一种基于双目视觉的工件三维尺寸高精度测量方法
KR101841750B1 (ko) 매칭 정보에 의한 입체 영상 보정 장치 및 그 방법
CN116625249A (zh) 基于2d和3d视觉的工件自动检测方法、装置及其相关介质
CN116883498A (zh) 基于灰度质心提取算法的视觉合作靶标特征点定位方法
CN115035175A (zh) 一种三维模型构建数据处理方法及***
CN113129348B (zh) 一种基于单目视觉的道路场景中车辆目标的三维重建方法
CN111630569B (zh) 双目匹配的方法、视觉成像装置及具有存储功能的装置
CN111598901B (zh) 基于深度图像的牙科修复制品的加工进度的估算方法
CN114882122A (zh) 图像局部自动标定方法、装置及相关设备
CN110942480A (zh) 一种单目单帧多光谱三维成像方法
CN111985535A (zh) 一种通过神经网络优化人体深度图的方法及其装置
CN110838148A (zh) 一种双目相机自标定方法
CN117541537B (zh) 基于全景点云融合技术的时空差异检测方法及其***
CN116188497B (zh) 立体遥感影像对生成dsm优化方法、装置、设备及存储介质
CN115063372B (zh) 设施主体形变监测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination