CN113239785A

CN113239785A - 一种基于卷积神经网络的户型自动识别的方法、***、存储介质及电子设备

Info

Publication number: CN113239785A
Application number: CN202110509758.8A
Authority: CN
Inventors: 夏江东; 周海
Original assignee: Baianju Information Technology Shanghai Co ltd
Current assignee: Baianju Information Technology Shanghai Co ltd
Priority date: 2021-05-11
Filing date: 2021-05-11
Publication date: 2021-08-10

Abstract

本发明提供一种基于卷积神经网络的户型自动识别的方法、***、存储介质及电子设备。所述方法包括：输入待识别二维户型图到户型关键点预测模型；获取所述二维户型图中墙体、门窗的关键点位置数据，所述关键点位置数据包括该点属于墙体、门窗对应类别的概率；根据所述墙体、门窗关键点位置数据将所述关键点转化为线段，并对所述线段进行扩展，校正所述线段位置偏差；输出所述二维户型图识别结果。本发明能够解决了传统户型识别泛化能力不够的问题，同时极大程度上提高了墙体线位置识别的准确率，避免装修设计师人力资源的浪费，提高了装修设计师的设计效率。

Description

一种基于卷积神经网络的户型自动识别的方法、***、存储介质及电子设备

技术领域

本发明涉及户型识别，特别是涉及一种基于卷积神经网络的户型自动识别的方法、***、存储介质及电子设备。

背景技术

在装修设计领域，随着互联网技术与人工智能技术的飞速发展，各种在线进行家装设计需求激增，在自动布局方面和三维重建方面，户型图的自动识别都具有重要。

目前二维户型图的识别主要有三种方法：以户型图作为临摹底图手动重构户型特征；通过opencv模型以边缘检测手段识别二维户型图中墙体、门及窗的位置以及基于深度学习的目标检测模型提取户型特征。其中第一种方法，会消耗大量的人力资源，并且效率及其低下；第二种方法通过阈值的调整，只能满足部分户型图识别的需求，保证不了识别模型的泛化能力，第三种方法会丢失一部分检测目标，并且检测出的构件位置会有一定的偏差。

发明内容

鉴于以上所述现有技术的缺点，本发明的目的在于提供一种基于卷积神经网络的户型自动识别的方法、***、存储介质及电子设备，用于解决现有技术中的以上问题。

为实现上述目的及其他相关目的，本发明提供一种基于卷积神经网络的户型自动识别的方法，所述方法包括：输入待识别二维户型图到户型关键点预测模型；获取所述二维户型图中墙体、门窗的关键点位置数据，所述关键点位置数据包括该点属于墙体、门窗对应类别的概率；根据所述墙体、门窗关键点位置数据将所述关键点转化为线段，并对所述线段进行扩展，校正所述线段位置偏差；输出所述二维户型图识别结果。

于本发明一实施例中，所述方法还包括：输入待识别二维户型图片可以是户型图片的RGB值，并将所述户型图片的RGB值统一转化为同一格式的三维数组。

于本发明一实施例中，所述方法还包括：所述待识别二维户型图包括传统方正户型图。

于本发明一实施例中，所述方法还包括建立所述户型关键点预测模型：标注所述墙体、门窗关键点位置数据并转化为概率图；抽取所述二维户型图语义特征，并将语义特征转换成期望的所述墙体、门窗关键点位置；构建损失函数，优化所述户型关键点预测模型的参数；训练迭代优化所述户型关键点预测模型。

于本发明一实施例中，所述方法中所述墙体、门窗关键点位置数据还包括：所述二维户型图中每个像素位置属于所述墙体、门窗关键点位置的所属类别数据、坐标数据、连接方向数据以及对应类别的概率；所述二维户型图中每个像素点越远于所述墙体、门窗关键点位置的概率越接近于m，距离所述墙体、门窗关键点位置越近的概率越接近于n，所述m、n为预设阈值。

于本发明一实施例中，所述方法还包括：通过Gaussian函数处理标注所述墙体、门窗关键点位置数据。

于本发明一实施例中，所述方法还包括：通过卷积神经网络抽取所述语义特征，将输入的所述二维户型图数据通过权值共享的全连接和下采样实现压缩，生成语义向量，并从depth,width,resolution三个维度放大所述户型关键点预测模型网络结构，以增加网络的性能，提高模型预测的准确率。

于本发明一实施例中，所述方法还包括：在所述语义特征抽取压缩后通过所述损失函数将所述二维户型图的每个像素点转换为墙体、门窗关键点的概率数值，所述概率数值在预设阈值m～n之间；所述损失函数可以采用y＝sigmoid(x)函数。

于本发明一实施例中，所述方法还包括：通过获取二维户型图样本、或经过数据增广的二维户型图样本及其标注的关键点位置数据，训练迭代优化所述户型关键点预测模型。

于本发明一实施例中，所述方法还包括：根据所述墙体、门窗关键点位置数据将所述关键点形成线段；以所述线段为中心线向两边扩展形成矩形区域；将所述矩形区域进行图像处理以校正墙体线位置。

为实现上述目的及其他相关目的，本发明提供基于卷积神经网络的户型自动识别的***，所述***包括：二维户型图输入模块，用于输入待识别二维户型图到户型关键点预测模型；关键点位置数据获取模块，用于获取所述二维户型图中墙体、门窗的关键点位置数据；关键点处理模块，用于根据所述墙体、门窗关键点位置数据将所述关键点转化为线段，并对所述线段进行扩展，校正所述线段位置偏差；识别结果输出模块，用于输出所述二维户型图识别结果。

为实现上述目的及其他相关目的，本发明提供一种计算机可读存储介质，其中存储有计算机程序，所述计算机程序被处理器加载执行时，实现所述的鼠标操作模拟方法。

为实现上述目的及其他相关目的，本发明提供一种电子设备，包括：处理器、存储器、及通信接口；其中，所述存储器用于存储计算机程序；所述处理器用于加载执行所述计算机程序，以使所述电子设备执行所述的基于卷积神经网络的户型自动识别方法；所述通信接口用于实现访问装置与其他设备之间的通信。

如上所述，本发明的基于卷积神经网络的户型自动识别的方法、***、存储介质及电子设备，装修设计师在将户型设计时无需以二维户型图作为临摹底图手动重构户型特征，避免消耗大量的人力资源。本发明还解决了传统户型识别泛化能力不够的问题，即某些技术只能识别既有一定特征的户型图，同时极大程度上提高了墙体线位置识别的准确率，以及提高了装修设计师的设计效率。

附图说明

图1显示为本发明一实施例中的户型自动识别方法的流程示意图。

图2显示为本发明一实施例中的关键点预测模型建立的具体流程示意图。

图3显示为本发明一实施例中的像素点所属关键点类别及概率示意图。

图4显示为本发明一实施例中关键点预测模型建立样本获取及处理的流程示意图。

图5显示为本发明一实施例中的户型自动识别***的模块示意图。

图6显示为本发明一实施例中的电子设备的结构示意图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

为了解决现有技术中装修设计师在进行户型设计前需根据户型图手动重构户型特征，浪费人力资源或者采用现有技术进行户型识别的泛化能力不够以及识别准确率不高的技术问题，本发明提供一种基于卷积神经网络的户型自动识别的方法、***、存储介质及电子设备。

如图1所示，本实施例提供一种基于基于卷积神经网络的户型自动识别的方法，该方法包括如下步骤：

S11：输入待识别二维户型图到户型关键点预测模型。

具体的，输入到所述户型关键点预测模型的待识别二维户型图需要数值化，以便计算机模型能够识别，本方法将二维户型图图片转换成RGB像素值作为模型的输入，优选的，RGB像素值的具体实施过程可以通过python的Pyqt5模块进行。

进一步的，需要将二维户型图图片的RGB像素值统一转化为同一格式的三维数组，例如：统一转化成512*512*3的三维数组。

进一步的，所述待识别二维户型图为实际户型图的等比例缩放户型图。

进一步的，所述待识别二维户型图为传统方正户型图。

S12：获取所述二维户型图中墙体、门窗的关键点位置数据，所述关键点位置数据包括该点属于墙体、门窗对应类别的概率。

具体的，通过所述关键点预测模型判断所述输入的待识别二维户型图中每个像素点属于墙体、门窗的关键点对应类别的概率，获取所述二维户型图中每个像素位置属于所述墙体、门窗关键点类别数据、坐标数据、连接方向数据以及对应类别的概率数据。优选的，所述墙体、门窗的关键点为二维户型图中墙体、门窗线段的端点。

进一步的，所述二维户型图中每个像素点越远于所述墙体、门窗关键点位置的概率越接近于m，距离所述墙体、门窗关键点位置越近的概率越接近于n，所述m、n为预设阈值。例如：越距离墙体关键点位置越远的像素点的概率越接近0，距离越近的像素点的概率越接近1。

进一步的，所述二维户型图中每个像素点属于墙体、门窗的关键点对应类别的概率可以用概率图表示，如图3所示：墙体关键点概率图31表示该待识别二维户型图该范围内像素点属于墙体关键点的概率图，该范围内越中心位置像素点的属于墙体关键点的概率越趋近于预设阈值1，越边缘的位置像素点属于墙体关键点的概率越趋近于预设阈值0。其他例如门关键点概率图32和窗关键点概率图33的概率图表示与之相同，

优选的，可以通过Gaussian函数处理所述墙体、门窗关键点位置数据。

S13：根据所述墙体、门窗关键点位置数据将所述关键点转化为线段，并对所述线段进行扩展，校正所述线段位置偏差。

具体而言，本步骤对S12获取的所述二维户型图中墙体、门窗的关键点位置数据进行后处理，例如：根据获取关键点数据的依据所述类别数据、坐标数据、方向数据，概率数据形成一些线段，以每条线段为中心线，向两边扩展为矩形区域，在该局部区域通过opencv进行图像的二值化处理，边缘提取，进行墙体线的位置校正。

S14：输出所述二维户型图识别结果，以便设计师根据输出的户型图进行装修设计。

具体而言，为实现上述发明方法需建立所述户型关键点预测模型，该关键点预测模型是一种概率估计模型，主要为了估计出户型图中墙体关键点，门窗这些关键点，所述户型关键点预测模型的建立如图2所示，包括以下步骤：

S21：标注所述墙体、门窗关键点位置数据并转化为概率图。

举例而言，通过二维户型图样本进行关键点数据标注，将所述二维户型图图片转换成RGB像素值，将所述二维户型图的墙体关键点像素位置、门窗关键点像素位置，和墙体、门窗分别定义为3个不同的类别，优选的像素位置的具体实施过程可以通过python的Pyqt5模块进行。

进一步的，将所述二维户型图作为底图，画出每个墙体、门窗的中心线，每条中心线的关键点即为像素位置。优选的，所述关键点为中心线端点。

进一步的，标注好的关键点数据以坐标形式体现，并且以概率图来表示。

S22：抽取所述二维户型图语义特征，并将语义特征转换成期望的所述墙体、门窗关键点位置。

具体的，所述语义特征信息可以理解成是图像的纹理，颜色，或者目标的类别等信息，例如，在检测网络中，一个图像输入到网络中，经过一层层的卷积之后，语义信息会越来越明显。

进一步的，通过抽取二维户型图样本的语义特征，将所述语义特征转换成期望的所述墙体、门窗关键点位置。进一步的，该语义特征抽取器为卷积网络，所述卷积网络将输入得二维户型图关键点数据通过权值共享的全连接和下采样实现压缩，生成语义向量，并从depth,width,resolution三个维度放大模型网络结构，增加参数量，以便增加网络的性能，提高所述关键点预测模型预测的准确率。优选的，该模型的特征抽取器为Efficientnet卷积网络。

S23：构建损失函数，优化所述户型关键点预测模型的参数。

具体的，优化所述户型关键点预测模型参数即通过构建损失函数进行反向传播而实现的，本发明方法的损失函数主要定义的是二维户型图的每个像素为墙体、门窗关键点的概率，取值范围可以预设为为m～n，优选的，取值范围为0～1，根据S22步骤经由所述语义特征抽取器压缩出的户型图语义特征，需要进一步转换成数值为0～1的结果，而y＝sigmoid(x)函数可实现该转换，即y＝1/(1+e^-x)，同时该函数是具有单增可导的S型函数，可以满足卷积神经网络的反向传播需求。

S24：训练迭代优化所述户型关键点预测模型。

具体而言，迭代优化所述户型关键点预测模型需根据所述二维户型图样本、以及经过数据增广的样本及其标注的特征，进行模型训练。

进一步的将二维户型图关键点数据输入进建立好的深度学习模型，并且以标注后并转换成概率图的关键点数据作该二维户型图的标签，不断训练迭代所述户型关键点预测模型，以使所述模型具备预测的能力。

需要说明的是，在建立所述户型关键点预测模型及对其进行训练迭代优化时，需要大量二维户型图样本，而所述二维户型图样本获取及处理方式如图4所示，具体实现方式例如：

S41：获取户型关键点预测模型训练样本。

先是通过爬虫技术获取不同开放平台的二维户型图，再是通过深度学***台、色调、风格、户型大小等方面进行分类，然后每种类别选取相同数量的二维户型图，最后将分类后的二维户型图作为所述户型关键点预测模型学习训练的样本。

S42：标注样本关键特征。

该步骤同步骤S21，在此不做过多赘述。

S43：通过数据增广增加样本。

在通过步骤S41进行了大量多样性样本的选择，但是人为选择的样本总是存在一定的局限性，所以通过数据增广，调整一些随机因子，变换已有的样本，达到样本的多样性。数据增广主要用于增加训练数据集，让数据集尽可能的多样化，使得训练的模型具有更强的泛化能力。

具体方法可以将已有的二维户型图样本进行镜像、平移、放缩、色彩变换、亮度变换、背景噪音增加等，并对例如平移的像素数量，放缩的比例，色调变化的比例等设置相应的操作系数，所述操作系数都可以定义为随机量，以便所述二维户型图样本的数量成几何倍增长。

实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。基于这样的理解，本发明还提供一种计算机程序产品，包括一个或多个计算机指令。所述计算机指令可以存储在计算机可读存储介质中。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。

参阅图5，本实施例提供一种户型自动识别***50，作为一款软件搭载于电子设备中，以在运行时执行前述方法实施例所述的基于卷积神经网络的户型自动识别的方法。由于本***实施例的技术原理与前述方法实施例的技术原理相似，因而不再对同样的技术细节做重复性赘述。

本实施例的户型自动识别***50具体包括：二维户型图输入模块51、关键点位置数据获取模块52、关键点处理模块53、识别输出模块54。二维户型图输入模块51用于输入待识别二维户型图到户型关键点预测模型；关键点位置数据获取模块52用于获取所述二维户型图中墙体、门窗的关键点位置数据；关键点处理模块53根据所述墙体、门窗关键点位置数据将所述关键点转化为线段，并对所述线段进行扩展，校正所述线段位置偏差；识别输出模块54用于输出所述二维户型图识别结果。

本领域技术人员应当理解，图5实施例中的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个或多个物理实体上。且这些模块可以全部以软件通过处理元件调用的形式实现，也可以全部以硬件的形式实现，还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，关键点处理模块52可以为单独设立的处理元件，也可以集成在某一个芯片中实现，此外，也可以以程序代码的形式存储于存储器中，由某一个处理元件调用并执行关键点处理模块52的功能。其它模块的实现与之类似。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

参阅图6，本实施例提供一种电子设备，电子设备可以是便携式电脑、智能手机、平板电脑等设备。详细的，电子设备至少包括通过总线61连接的：存储器62、处理器63、通信接口64，其中，通信接口64用于用于实现访问装置与其他设备之间的通信，存储器62用于存储计算机程序，处理器63用于执行存储器62存储的计算机程序，以执行前述方法实施例中的全部或部分步骤。

上述提到的***总线可以是外设部件互连标准(Peripheral PomponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该***总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory，简称RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

综上所述，本发明的一种基于卷积神经网络的户型自动识别的方法、***、存储介质及电子设备，能通过输入二维户型图自动识别户型及其构件，解决了传统户型识别泛化能力不够的问题，即某些技术只能识别既有一定特征的户型图，同时极大程度上提高了墙体线位置识别的准确率，以及提高了装修设计师的设计效率。所以，本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

Claims

1.一种基于卷积神经网络的户型自动识别的方法，其特征在于，包括：

输入待识别二维户型图到户型关键点预测模型；

获取所述二维户型图中墙体、门窗的关键点位置数据，所述关键点位置数据包括该点属于墙体、门窗对应类别的概率；

根据所述墙体、门窗关键点位置数据将所述关键点转化为线段，并对所述线段进行扩展，校正所述线段位置偏差；

输出所述二维户型图识别结果。

2.根据权利要求1所述的方法，其特征在于，还包括：

输入待识别二维户型图片可以是户型图片的RGB值，并将所述户型图片的RGB值统一转化为同一格式的三维数组。

3.根据权利要求1或2所述的方法，其特征在于，所述待识别二维户型图包括对实际户型图的进行等比例缩放的二维户型图。

4.根据权利要求1所述的方法，其特征在于，还包括建立所述户型关键点预测模型：

标注所述墙体、门窗关键点位置数据并转化为概率图；

抽取所述二维户型图语义特征，并将语义特征转换成期望的所述墙体、门窗关键点位置；

构建损失函数，优化所述户型关键点预测模型的参数；

训练迭代优化所述户型关键点预测模型。

5.根据权利要求1或4所述的方法，其特征在于，所述墙体、门窗关键点位置数据还包括：

所述二维户型图中每个像素位置属于所述墙体、门窗关键点位置的所属类别数据、坐标数据、连接方向数据以及对应类别的概率；

所述二维户型图中每个像素点越远于所述墙体、门窗关键点位置的概率越接近于m，距离所述墙体、门窗关键点位置越近的概率越接近于n，所述m、n为预设阈值。

6.根据权利要求5所述的方法，其特征在于，还包括通过Gaussian函数处理标注所述墙体、门窗关键点位置数据。

7.根据权利要求4所述的方法，其特征在于，还包括：

通过卷积神经网络抽取所述语义特征，将输入的所述二维户型图数据通过权值共享的全连接和下采样实现压缩，生成语义向量，并从depth,width,resolution三个维度放大所述户型关键点预测模型网络结构，以增加网络的性能，提高模型预测的准确率。

8.根据权利要求4或7所述的方法，其特征在于，还包括：

在所述语义特征抽取压缩后通过所述损失函数将所述二维户型图的每个像素点转换为墙体、门窗关键点的概率数值，所述概率数值在预设阈值m～n之间；

所述损失函数可以采用y＝sigmoid(x)函数。

9.根据权利要求4所述的方法，其特征在于，还包括：

通过获取二维户型图样本、或经过数据增广的二维户型图样本及其标注的关键点位置数据，训练迭代优化所述户型关键点预测模型。

10.根据权利要求1所述的方法，其特征在于，还包括：

根据所述墙体、门窗关键点位置数据将所述关键点形成线段；

以所述线段为中心线向两边扩展形成矩形区域；

将所述矩形区域进行图像处理以校正墙体线位置。

11.一种基于卷积神经网络的户型自动识别的***，其特征在于，所述***包括：

二维户型图输入模块，用于输入待识别二维户型图到户型关键点预测模型；

关键点位置数据获取模块，用于获取所述二维户型图中墙体、门窗的关键点位置数据；

关键点处理模块，用于根据所述墙体、门窗关键点位置数据将所述关键点转化为线段，并对所述线段进行扩展，校正所述线段位置偏差；

识别结果输出模块，用于输出所述二维户型图识别结果。

12.一种计算机可读存储介质，其中存储有计算机程序，其特征在于，所述计算机程序被处理器加载执行时，实现如权利要求1至10中任一所述的基于卷积神经网络的户型自动识别方法。

13.一种电子设备，其特征在于，包括：处理器、存储器、及通信接口；其中，

所述存储器用于存储计算机程序；

所述处理器用于加载执行所述计算机程序，以使所述电子设备执行如权利要求1至10中任一所述的基于卷积神经网络的户型自动识别方法；

所述通信接口用于实现访问装置与其他设备之间的通信。