CN116385859A - 图元识别方法、装置、计算机设备及其介质 - Google Patents
图元识别方法、装置、计算机设备及其介质 Download PDFInfo
- Publication number
- CN116385859A CN116385859A CN202310377519.0A CN202310377519A CN116385859A CN 116385859 A CN116385859 A CN 116385859A CN 202310377519 A CN202310377519 A CN 202310377519A CN 116385859 A CN116385859 A CN 116385859A
- Authority
- CN
- China
- Prior art keywords
- primitive
- original
- connected domain
- household
- coordinate system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000011218 segmentation Effects 0.000 claims abstract description 58
- 230000001131 transforming effect Effects 0.000 claims abstract description 15
- 230000009466 transformation Effects 0.000 claims description 19
- 238000004891 communication Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 5
- 238000011960 computer-aided design Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000000605 extraction Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 210000000746 body region Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
- G06V20/36—Indoor scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
- G06T17/10—Constructive solid geometry [CSG] using solid primitives, e.g. cylinders, cubes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/20—Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/04—Architectural design, interior design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2219/00—Indexing scheme for manipulating 3D models or images for computer graphics
- G06T2219/20—Indexing scheme for editing of 3D models
- G06T2219/2016—Rotation, translation, scaling
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Architecture (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请实施例属于图元识别技术领域,尤其涉及图元识别方法、装置、计算机设备及其介质,其中,所述方法包括获取原始坐标系下的户型图元,根据预设的图像缩放比,将多个户型图元变换到预设的图像坐标系中,得到原始位图,将原始位图输入到预设的实例分割模型中,得到掩码图,其中,掩码图包括各个户型图元对应的实例分割区域和户型图元所属的构件类别,即通过将户型图元统一转换到图像坐标系中,使其绘制成固定大小的原始位图,同时,绘制成固定大小的原始位图便于后续通过实例分割模型实现位图的分割,进而识别得到各个实例分割区域和所属的构件类别,相较于传统基于有限的规则识别方式鲁棒性更强,使用范围更广,灵活性更好。
Description
技术领域
本申请涉及图元识别技术领域,尤其涉及图元识别方法、装置、计算机设备及其介质。
背景技术
不论是户型的硬装设计还是软装布局,均需要获得一个精准的户型描述。相关技术中,CAD(Computer Aided Design,计算机辅助设计)翻模常用于对设计图纸的建模。CAD翻模的过程可以理解成两个核心环节,即“图元识别”以及“建模”。关于图元识别,当前的主流方式主要以图层约定以及特征识别为主。前者通过提前与图纸绘制者约定关键词将相关类型的构件绘制在同一图层且用指定关键词进行命名,方便后续提取,缺点是针对不同的图纸,绘图者都需要与其提前沟通确认绘图方式以及关键词命名方式,灵活性较差。后者通过例如规则总结的“几何特征”、“颜色特征”、“图例特征”等特征识别相关类型的构件图元,缺点是依赖专业人员对以往图纸的归纳总结,泛用性较差,一旦出现规则无法覆盖的图纸就会识别失败。上述两种已有识别方法存在的缺陷也导致了实际翻模后的户型与原始图纸差异较大的情况。
相关技术中的图元识别技术存在灵活性较差以及泛化性较弱的问题。
发明内容
本申请实施例的目的在于提出一种图元识别方法、装置、计算机设备及其介质,解决相关技术对图元识别灵活性较差和泛化性较弱的问题。
为了解决上述技术问题,本申请实施例提供一种图元识别方法,包括:
获取原始坐标系下的户型图元;
根据预设的图像缩放比,将多个户型图元变换到预设的图像坐标系中,得到原始位图;
将原始位图输入到预设的实例分割模型中,得到掩码图,其中,掩码图包括各个户型图元对应的实例分割区域和户型图元所属的构件类别。
为了解决上述技术问题,本申请实施例还提供一种图元识别装置,包括:
获取模块,用于获取原始坐标系下的户型图元;
变换模块,用于根据预设的图像缩放比,将多个户型图元变换到预设的图像坐标系中,得到原始位图;
分割模块,用于将原始位图输入到预设的实例分割模型中,得到掩码图,其中,掩码图包括各个户型图元对应的实例分割区域和户型图元所属的构件类别。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述图元识别方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的图元识别方法的步骤。
与相关技术相比,本申请实施例主要有以下有益效果:
通过获取原始坐标系下的户型图元,根据预设的图像缩放比,将多个户型图元变换到预设的图像坐标系中,得到原始位图,将原始位图输入到预设的实例分割模型中,得到掩码图,其中,掩码图包括各个户型图元对应的实例分割区域和户型图元所属的构件类别,即通过将户型图元统一转换到图像坐标系中,使其绘制成固定大小的原始位图,解决了不同图纸的构件大小和差异需预先约定好绘图方式等灵活性差的问题,同时,绘制成固定大小的原始位图便于后续通过实例分割模型实现位图的分割,进而识别得到各个实例分割区域和所属的构件类别,相较于传统基于有限的规则识别方式鲁棒性更强,使用范围更广,灵活性更好。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性***架构图;
图2是本申请的图元识别方法的一个实施例的流程图;
图3是本申请一实施例中的原始位图的示意图;
图4是本申请一实施例中的掩模图的示意图;
图5是本申请一实施例中的连通域的示意图;
图6是本申请一实施例中的轮廓线的示意图;
图7是本申请一实施例中的门窗区域的示意图;
图8是本申请一实施例中的图元识别方法的另一个实施例的流程图;
图9是本申请的图元识别装置的一个实施例示意图;
图10是本申请的计算机设备基本结构框图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
基于此,本申请提供一种图元识别方法来解决上述技术问题。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的图元识别方法由服务器/终端设备执行,相应地,图元识别装置一般设置于服务器/终端设备中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,图2本申请的图元识别方法的一个实施例的流程图,上述方法包括:
S201:获取原始坐标系下的户型图元。
户型图元为原始CAD文件中原始户型的图元矢量元素,其中,图元矢量元素包括直线、圆、椭圆、圆弧、椭圆弧、贝塞尔曲线、折线(polyline)、非均匀有理B样条(nurbs Curve)等元素,图元矢量元素还包括通过上述元素构成的复合线以及面。此时的户型图元所在的原始坐标系为原始CAD文件的三维坐标系。在三维坐标系下的户型图元为尚未进行几何变化的图元矢量元素。
获取户型图元的方式可以是通过本地存储的原始CAD文件进行导入,或者通过服务器遍历原始CAD文件所在的路径进行导入等,此处不做限定。
S202:根据预设的图像缩放比,将多个户型图元变换到预设的图像坐标系中,得到原始位图。
由于户型图元在每个CAD图纸的绘图标准不一致,导致很难采用统一的规则总结相应构件的绘制方式。因此,为自动识别不同户型图元所属的构件类别在CAD图纸中对应的展示方式,以统一图纸各构件类别的展示规范性,需要将户型图元进行缩放和平移,将投射到图像坐标系的户型图元构成原始位图。
其中,图像缩放比为基于固定的物理到图像的缩放比,例如设置图像缩放比为(scalex,scaley),scalex表示户型图元在x轴的缩放,scaley表示户型图元在y轴的缩放。通过预设的图像缩放比将多个户型图元变换到预设的图像坐标系中。例如,将一端直线进行缩放和平移,或者将一段圆弧进行缩放和平移。
在一实施例中,根据预设的图像缩放比,将多个户型图元变换到预设的图像坐标系中,得到原始位图,包括:
获取预设的图像缩放比和图像中心;
根据多个户型图元构建包围盒;
确定包围盒的中心位置;
根据包围盒的中心位置和图像中心,确定偏移值;
基于图像缩放比和偏移值构造变换矩阵;
根据变换矩阵将户型图元变换到图像坐标系中,得到原始位图。
具体地,基于原始CAD文件的跨度所对应的图像尺寸,得到图像中心,可以将图像中心表示为ImageCenter。通过计算多个户型图元所在的原始CAD文件的包围盒,并基于图像缩放比计算包围盒的中心位置,包围盒的中心位置可以表示为scaleBoxCenter。因此,偏移值=图像中心-包围盒的中心位置=ImageCenter-scaleBoxCenter,偏移值可以表示为(offsetx,offsety),offsetx表示户型图元在x轴的平移,offsety表示户型图元在y轴的平移。
进一步地,通过将遍历到的户型图元经过上述的二维仿射变换矩阵进行变换,得到经过缩放和平移后的各个户型图元构成的原始位图,即原始位图为二维图像。如图3所示,图3是本申请一实施例中的原始位图的示意图。
S203:将原始位图输入到预设的实例分割模型中,得到掩码图,其中,掩码图包括各个户型图元对应的实例分割区域和户型图元所属的构件类别。
其中,实例分割模型可以是实例分割神经网络,是目标检测网络和语义分割网络所结合的神经网络模型,在原始位图中检测各个户型图元对应的实例分割区域(即对应的像素区域),并对每个实例分割区域打上标签,得到户型图元所属的构件类别。掩码图是对实例分割区域的可视化显示,例如对实例分割区域填充同一像素值。掩码图中的实力分割区域可以是指检测到的墙体、柱子以及门窗等。
具体地,基于上述步骤S202处理后的原始位图,利用实例分割模型对原始位图进行分析,提取出墙体、柱子以及门窗的实例分割区域的结果。需要说明的是,实例分割模型对家具图例、图纸边框的像素区域不进行分割识别。
在一实施例中,对原始位图的预处理包括对原始位图的像素值进行归一化操作,以及将归一化后的原始位图缩放到固定的尺寸大小;将预处理后的原始位图输入到实例分割模型中,得到每个实例的所在区域(也就是实例分割区域)、实例分割区域对应的语义类别(即户型图元所属的构件类别)以及对应的置信度;通过置信度阈值过滤置信度较低的预测结果,保留高的置信度的实例分割区域,其中,输出的可视化结果如图所示,图4是本申请一实施例中的掩模图的示意图,其中,构件类别可以为窗41,墙体42和门43等。在掩模图中,采用不同的像素值填充表示不同的构件类别对应的实例分割区域,例如墙体和柱子用红色表示、门用绿色表示、窗用蓝色表示。
通过获取原始坐标系下的户型图元,根据预设的图像缩放比,将多个户型图元变换到预设的图像坐标系中,得到原始位图,将原始位图输入到预设的实例分割模型中,得到掩码图,其中,掩码图包括各个户型图元对应的实例分割区域和户型图元所属的构件类别,即通过将户型图元统一转换到图像坐标系中,使其绘制成固定大小的原始位图,解决了不同图纸的构件大小和差异需预先约定好绘图方式等灵活性差的问题,同时,绘制成固定大小的原始位图便于后续通过实例分割模型实现位图的分割,进而识别得到各个实例分割区域和所属的构件类别,相较于传统基于有限的规则识别方式鲁棒性更强,使用范围更广,灵活性更好。
在一实施例中,在将原始位图输入到预设的实例分割模型中,得到掩码图之后,上述方法还包括:
从原始位图中确定原始户型中闭合的第一连通域;
将掩码图和第一连通域进行交并比运算,得到第二连通域。
由于实例分割模型输出的是符合置信度阈值的各个实例分割区域,也就是实例分割模型输出的掩码图存在细微的像素误差,因此,为了提高实力分割区域和户型图元的位置信息进行精准关联,需采用间接的方式提取有效区域,具体流程如下:
具体地,基于原始位图提取原始户型中闭合的第一连通域;将实例分割模型输出的掩码图上采样到原始位图的分辨率,使得上采样后的掩码图和原始位图保持一样的尺寸大小,例如,当实例分割模型输出的掩码图的尺寸为400*400,原始位图的尺寸是800*800,此时可以通过openCV提供的插值函数,通过设定上采样的目标尺寸,并指定插值方式,实现掩码图由原来的低分辨率400*400到高分辨800*800的上采样过程;将上采样后的掩码和第一连通域做交并比运算,得到掩码图和第一连通域的交集区域,若交集区域大于或等于预设的交集阈值,则交集区域为第二连通域。其中,第二连通域可以表示实际的有效墙体和柱子区域。
在一实施例中,在将掩码图和第一连通域进行交并比运算,得到第二连通域之后,上述方法还包括:
基于第二连通域,将原始位图进行二值化处理,得到二值化图像。
为了方便展示第二连通域,可以对第二连通域随机着色,例如通过第二连通域的位置信息对原始位图进行二值化处理得到二值化图像,其可视化结果如图5所示,图5是本申请一实施例中的连通域的示意图。
在一实施例中,在将掩码图和第一连通域进行交并比运算,得到第二连通域之后,上述方法还包括:
根据二值化图像和原始位图中的户型图元,提取与第二连通域匹配的轮廓线。
在得到有效的第二连通域之后,可以将第二连通域映射回原始位图,和原始图元进行拟合,实现边线提取,其中,边线可以包括墙边线和柱子边线等。为了精准提取第二连通域中的有效边线,可以基于二值化图像和对应的户型图元进行提取,具体包括:
对二值化图像中的第二连通域进行取反,得到第三连通域,其中,第三连通域为在图像坐标系下的户型图元的连通区域;
提取第三连通域的轮廓像素区域;
将在图像坐标系下的户型图元与轮廓像素区域进行匹配,得到与第二连通域匹配的轮廓线。
由于原始位图为白底黑线,第二连通域提取的是基于像素值>0的区域,如果不取反,获取的区域其实代表的是户型图元内部的区域,例如可以理解为墙体包围的房间区域,因此需要再进行一次取反,使得墙体区域像素值>0,才能提取到墙体区域。
在一实施例中,基于二值化图像的第二连通域,进行图像的开闭运算,实现噪点去除以及缝隙融合。将开闭运算后的第二连通域进行取反,得到实际包含户型图元的第三连通区域。提取第三连通区域的轮廓像素区域,并将户型图元在原始位图在图像坐标系中对应的像素区域与第三连通区域的轮廓像素区域进行交并比计算,该交并比的过程可以理解为匹配户型图元的轮廓线过程。
具体地,查询当前要匹配的户型图元在原始位图的像素点位置,并计算该户型图元所占的像素总个数(可以记为a);判断当前要匹配的户型图元在轮廓像素区域中的像素个数(可以记为b);判断当前要匹配的户型图元在开闭运算后的第二连通域中得到的非墙体区域掩码的像素个数(可以记为c);假如b/a>阈值1,并且c/a<阈值2,即为符合条件匹配的户型图元,此时通过匹配的户型图元,得到与第二连通域匹配的轮廓线,其可视化结果如图6所示,图6是本申请一实施例中的轮廓线的示意图。
在一实施例中,在将原始位图输入到预设的实例分割模型中,得到掩码图之后,上述方法还包括对门窗的几何轮廓提取,具体流程如下:
提取掩码图的外轮廓;
确定外轮廓的最小包围盒,其中,最小包围盒包括多个端点;
基于图像缩放比和偏移值,将多个端点映射到原始坐标系中,得到外轮廓对应的门窗区域。
具体地,对掩码图进行膨胀操作,并提取膨胀后的掩码图外轮廓;对外轮廓提取最小几何包围盒,并计算最小几何包围盒的端点;基于步骤S202中的图像缩放比(scalex,scaley)和偏移值(offsetx,offsety),做逆变换操作,将在图像坐标系中的最小几何包围盒的端点转换到原始坐标系中,实现将户型图元的逆变换。例如,输入为最小几何包围盒的端点坐标为(x,y),针对x轴的变换为(x-offsetx)*scalex,针对y轴的变换为(y-offsety)*-scaley。如图7所示,图7是本申请一实施例中的门窗区域的示意图,可知户型图元可以为窗71和门72。
本申请基于实例分割模型智能识别原始位图中的关键建筑构件区域,相较于传统基于有限的规则识别方式鲁棒性更强,使用范围更广,同时规避了深度学习推理结果中的像素不精确的问题,通过筛选有效的连通域实现精准的边线提取。
继续参考图8,图8是本申请一实施例中的图元识别方法的另一个实施例的流程图,具体过程如下步骤:
S801:获取CAD矢量图元;
S802:对CAD矢量图元进行缩放,将其映射到图像坐标系,按照固定的物理到图像缩放比,绘制成固定大小的位图;
S803:将位图输入到实例分割模型进行推理,获取不同实例的像素区域;
S804:基于原始图元的位图计算连通域,并筛选有效连通域;
S805:基于有效连通域,提取区域边线轮廓,并与原始图元在图像坐标系中的像素区域做有效判断,得到墙体边线图元;
S806:基于不同实例的像素区域构造门窗区域。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
进一步参考图9,作为对上述图2所示图元识别方法的实现,本申请提供了一种图元识别装置的一个实施例示意图,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图9所示,本实施例的图元识别装置包括:获取模块91、变换模块92及分割模块93。其中:
获取模块91,用于获取原始坐标系下的户型图元;
变换模块92,用于根据预设的图像缩放比,将多个户型图元变换到预设的图像坐标系中,得到原始位图;
分割模块93,用于将原始位图输入到预设的实例分割模型中,得到掩码图,其中,掩码图包括各个户型图元对应的实例分割区域和户型图元所属的构件类别。
在一实施例中,变换模块92包括:
获取单元,用于获取预设的图像缩放比和图像中心;
构建单元,用于根据多个户型图元构建包围盒;
第一确定单元,用于确定包围盒的中心位置;
第二确定单元,用于根据包围盒的中心位置和图像中心,确定偏移值;
构造单元,用于基于图像缩放比和偏移值构造变换矩阵;
变换单元,用于根据变换矩阵将户型图元变换到图像坐标系中,得到原始位图。
在一实施例中,图元识别装置还包括:
确定模块,用于从原始位图中确定原始户型中闭合的第一连通域;
交并模块,用于将掩码图和第一连通域进行交并比运算,得到第二连通域。
在一实施例中,交并模块包括:
二值化单元,用于基于第二连通域,将原始位图进行二值化处理,得到二值化图像。
在一实施例中,图元识别装置还包括:
提取模块,用于根据二值化图像和原始位图中的户型图元,提取与第二连通域匹配的轮廓线。
在一实施例中,提取模块包括:
取反单元,用于对二值化图像中的第二连通域进行取反,得到第三连通域,其中,第三连通域为在图像坐标系下的户型图元的连通区域;
提取单元,用于提取第三连通域的轮廓像素区域;
匹配单元,用于将在图像坐标系下的户型图元与轮廓像素区域进行匹配,得到与第二连通域匹配的轮廓线。
在一实施例中,图元识别装置还包括:
轮廓提取模块,用于提取掩码图的外轮廓;
端点确定模块,用于确定外轮廓的最小包围盒,其中,最小包围盒包括多个端点;
端点映射模块,用于基于图像缩放比和偏移值,将多个端点映射到原始坐标系中,得到外轮廓对应的门窗区域。
关于上述实施例中图元识别装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图10,图10为本实施例计算机设备基本结构框图。
所述计算机设备10包括通过***总线相互通信连接存储器101、处理器102、网络接口103。需要指出的是,图中仅示出了具有组件101-103的计算机设备10,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器101至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器101可以是所述计算机设备10的内部存储单元,例如该计算机设备10的硬盘或内存。在另一些实施例中,所述存储器101也可以是所述计算机设备10的外部存储设备,例如该计算机设备10上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器101还可以既包括所述计算机设备10的内部存储单元也包括其外部存储设备。本实施例中,所述存储器101通常用于存储安装于所述计算机设备10的操作***和各类应用软件,例如图元识别方法的程序代码等。此外,所述存储器101还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器102在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器102通常用于控制所述计算机设备10的总体操作。本实施例中,所述处理器102用于运行所述存储器101中存储的程序代码或者处理数据,例如运行所述图元识别方法的程序代码。
所述网络接口103可包括无线网络接口或有线网络接口,该网络接口103通常用于在所述计算机设备10与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有图元识别程序,所述图元识别程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的图元识别方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种图元识别方法,包括:
获取原始坐标系下的户型图元;
根据预设的图像缩放比,将多个所述户型图元变换到预设的图像坐标系中,得到原始位图;
将所述原始位图输入到预设的实例分割模型中,得到掩码图,其中,所述掩码图包括各个所述户型图元对应的实例分割区域和所述户型图元所属的构件类别。
2.根据权利要求1所述的图元识别方法,其特征在于,所述根据预设的图像缩放比,将多个所述户型图元变换到预设的图像坐标系中,得到原始位图,包括:
获取预设的图像缩放比和图像中心;
根据多个所述户型图元构建包围盒;
确定所述包围盒的中心位置;
根据所述包围盒的中心位置和所述图像中心,确定偏移值;
基于所述图像缩放比和所述偏移值构造变换矩阵;
根据所述变换矩阵将所述户型图元变换到所述图像坐标系中,得到所述原始位图。
3.根据权利要求1所述的图元识别方法,其特征在于,在所述将所述原始位图输入到预设的实例分割模型中,得到掩码图之后,所述方法还包括:
从所述原始位图中确定所述原始户型中闭合的第一连通域;
将所述掩码图和所述第一连通域进行交并比运算,得到第二连通域。
4.根据权利要求3所述的图元识别方法,其特征在于,在所述将所述掩码图和所述第一连通域进行交并比运算,得到第二连通域之后,所述方法还包括:
基于所述第二连通域,将所述原始位图进行二值化处理,得到二值化图像。
5.根据权利要求4所述的图元识别方法,其特征在于,所述方法还包括:
根据所述二值化图像和所述原始位图中的所述户型图元,提取与所述第二连通域匹配的轮廓线。
6.根据权利要求5所述的图元识别方法,其特征在于,所述根据所述二值化图像和所述原始位图中的所述户型图元,提取与所述第二连通域匹配的轮廓线,包括:
对所述二值化图像中的所述第二连通域进行取反,得到第三连通域,其中,所述第三连通域为在所述图像坐标系下的所述户型图元的连通区域;
提取所述第三连通域的轮廓像素区域;
将在所述图像坐标系下的所述户型图元与所述轮廓像素区域进行匹配,得到与所述第二连通域匹配的轮廓线。
7.根据权利要求2所述的图元识别方法,其特征在于,在所述将所述原始位图输入到预设的实例分割模型中,得到掩码图之后,所述方法还包括:
提取所述掩码图的外轮廓;
确定所述外轮廓的最小包围盒,其中,所述最小包围盒包括多个端点;
基于所述图像缩放比和所述偏移值,将多个所述端点映射到所述原始坐标系中,得到所述外轮廓对应的门窗区域。
8.一种图元识别装置,其特征在于,包括:
获取模块,用于获取原始坐标系下的户型图元;
变换模块,用于根据预设的图像缩放比,将多个所述户型图元变换到预设的图像坐标系中,得到原始位图;
分割模块,用于将所述原始位图输入到预设的实例分割模型中,得到掩码图,其中,所述掩码图包括各个所述户型图元对应的实例分割区域和所述户型图元所属的构件类别。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的图元识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的图元识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310377519.0A CN116385859A (zh) | 2023-04-06 | 2023-04-06 | 图元识别方法、装置、计算机设备及其介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310377519.0A CN116385859A (zh) | 2023-04-06 | 2023-04-06 | 图元识别方法、装置、计算机设备及其介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116385859A true CN116385859A (zh) | 2023-07-04 |
Family
ID=86976602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310377519.0A Pending CN116385859A (zh) | 2023-04-06 | 2023-04-06 | 图元识别方法、装置、计算机设备及其介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116385859A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117496181A (zh) * | 2023-11-17 | 2024-02-02 | 杭州中房信息科技有限公司 | 基于OpenCV的户型图识别方法、存储介质及设备 |
CN117974652A (zh) * | 2024-03-29 | 2024-05-03 | 大连智驱科技有限公司 | 基于机器视觉的超声影像辅助定位方法 |
-
2023
- 2023-04-06 CN CN202310377519.0A patent/CN116385859A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117496181A (zh) * | 2023-11-17 | 2024-02-02 | 杭州中房信息科技有限公司 | 基于OpenCV的户型图识别方法、存储介质及设备 |
CN117974652A (zh) * | 2024-03-29 | 2024-05-03 | 大连智驱科技有限公司 | 基于机器视觉的超声影像辅助定位方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11636234B2 (en) | Generating 3D models representing buildings | |
EP3506160B1 (en) | Semantic segmentation of 2d floor plans with a pixel-wise classifier | |
CN116385859A (zh) | 图元识别方法、装置、计算机设备及其介质 | |
Sun et al. | Template matching-based method for intelligent invoice information identification | |
CN112396613B (zh) | 图像分割方法、装置、计算机设备及存储介质 | |
Huang et al. | TP-LSD: Tri-points based line segment detector | |
CN112241565A (zh) | 建模方法及相关装置 | |
Mewada et al. | Automatic room information retrieval and classification from floor plan using linear regression model | |
CN111260564A (zh) | 一种图像处理方法和装置及计算机存储介质 | |
Zhao et al. | Region-based saliency estimation for 3D shape analysis and understanding | |
CN117593420A (zh) | 基于图像处理的平面图纸标注方法、装置、介质及设备 | |
CN114445844A (zh) | 板构件识别方法、装置、设备及存储介质 | |
CN108133116B (zh) | Cad户型图墙厚自动识别方法及*** | |
CN114332894A (zh) | 图像的文本检测方法及装置 | |
Tang et al. | Automatic structural scene digitalization | |
Fang et al. | Lane boundary detection algorithm based on vector fuzzy connectedness | |
CN112651399A (zh) | 检测倾斜图像中同行文字的方法及其相关设备 | |
CN111680680A (zh) | 一种目标码定位方法、装置、电子设备及存储介质 | |
Ruwanthika et al. | Dynamic 3D model construction using architectural house plans | |
CN110781851A (zh) | 一种基于图片的装修户型图识别方法 | |
CN113808192B (zh) | 一种户型图生成方法、装置、设备及存储介质 | |
Tabia et al. | Automatic reconstruction of heritage monuments from old architecture documents | |
CN112395834B (zh) | 基于图片输入的脑图生成方法、装置、设备及存储介质 | |
CN114936395A (zh) | 一种户型图识别方法、装置、计算机设备及存储介质 | |
Wolters et al. | Combined precise extraction and topology of points, lines and curves in man-made environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |