CN113658195B - 图像分割方法、装置及电子设备 - Google Patents
图像分割方法、装置及电子设备 Download PDFInfo
- Publication number
- CN113658195B CN113658195B CN202110939617.XA CN202110939617A CN113658195B CN 113658195 B CN113658195 B CN 113658195B CN 202110939617 A CN202110939617 A CN 202110939617A CN 113658195 B CN113658195 B CN 113658195B
- Authority
- CN
- China
- Prior art keywords
- point cloud
- component
- cloud component
- image data
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 238000003709 image segmentation Methods 0.000 title claims abstract description 61
- 230000011218 segmentation Effects 0.000 claims description 56
- 238000012549 training Methods 0.000 claims description 38
- 238000010801 machine learning Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 14
- 230000002708 enhancing effect Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012015 optical character recognition Methods 0.000 claims description 8
- 230000003287 optical effect Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 16
- 238000001514 detection method Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000012937 correction Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000001788 irregular Effects 0.000 description 2
- 241001310793 Podium Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/181—Segmentation; Edge detection involving edge growing; involving edge linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请属于人工智能技术领域,具体涉及一种图像分割方法、装置及相关设备,本申请通过将待分割图像数据点云化处理后,通过锚框标记和边框回归构造点云特征,通过预训练的机器学习模型识别出点云特征中的点云构件图形轮廓对应的标准点云构件类别,根据标准点云构件类别确定标准点云构件图形,最后以点云构件图形位置作为分割位置,使用标准点云构件图形在分割位置对点云图像数据执行分割,利用本申请的方法进行图像分割,分割准确率高,能够将待分割图像数据中标准的图形构件分割出来,而且,本申请只需要获取图形轮廓和位置即可执行分割,分割步骤简单,分割效率高,有利于图像分割的推广应用。
Description
技术领域
本申请属于人工智能技术领域,具体涉及一种图像分割方法、图像分割装置、计算机可读介质以及电子设备。
背景技术
图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。从数学角度来看,图像分割是将数字图像划分成互不相交的区域的过程。
现有的图像分割方法主要有两大类,分别是基于检测的图像分割方法和无检测的图像分割方法。而以上两种图像分割方法分割效率低,而且分割效果差,最终分割的图像与预期图像差距较大,不利于图像的处理。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本申请的目的在于提供一种图像分割方法、图像分割装置、计算机可读介质以及电子设备,至少在一定程度上克服相关技术中图像分割效率低,分割准确率低等技术问题。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供一种图像分割方法,包括:
点云化处理待分割图像数据,得到点云图像数据;所述点云图像数据包括若干点云构件图形,所述点云构件图形包括标准点云构件图形;
通过锚框标记和边框回归构造所述点云图像数据中与所述点云构件图形对应的点云特征,所述点云特征用于描述点云构件图形轮廓和点云构件图形位置;
针对所述点云图像数据中的点云构件图形,通过预训练的机器学习模型识别所述点云特征中的点云构件图形轮廓,得到标准点云构件类别,所述标准点云构件类别用于指示所述点云构件图形归属的标准点云构件图形;
以所述点云构件图形位置作为分割位置,使用所述标准点云构件图形在所述分割位置对所述点云图像数据执行分割。
在本申请的一些实施例中,基于以上技术方案,通过预训练的机器学习模型,识别所述点云特征中的点云构件图形轮廓,得到标准点云构件类别的步骤之前,所述方法还包括:
以点云构件图形轮廓样本为输入,以所述点云构件图形轮廓样本对应的标准点云构件类别为输出,对预构建的机器学习模型进行训练,得到预训练的机器学习模型。
在本申请的一些实施例中,基于以上技术方案,以点云构件图形轮廓样本为输入,以所述点云构件图形轮廓样本对应的标准点云构件类别为输出,对预构建的机器学习模型进行训练的方法,包括:
将所述点云构件图形轮廓样本通过掩码计算,通过所述掩码计算加强所述点云构件图形轮廓样本与所述标准点云构件类别的关联权重,所述关联权重用于增强所述点云构件图形轮廓样本与标准点云构件类别的关联程度;
将增强与所述点云构件图形轮廓样本关联程度的所述点云构件图形轮廓样本,输入所述机器学习模型进行迭代训练,直至收敛得到对点云构件图形轮廓增强识别的机器学习模型。
在本申请的一些实施例中,基于以上技术方案,所述点云图像数据包括所述点云构件图形的真实边界框,通过锚框标记和边框回归构造所述点云图像数据中与所述点云构件图形对应的点云特征,包括:
利用预训练类别和偏移量标签的锚框扫描所述点云图像数据,计算所述锚框与所述真实边界框的交并比,若所述交并比大于等于交并比阈值,将所述锚框作为预测边界框;
调整所述预测边界框的中心点和宽高,输出所述预测边界框的点云特征,所述点云特征包括类别和偏移量标签。
在本申请的一些实施例中,基于以上技术方案,所述方法还包括:
将所述待分割的图像数据通过光学字符识别,得到所述待分割的图像数据中构件图形的文字位置和构件图形的文字内容。
在本申请的一些实施例中,基于以上技术方案,将所述待分割的图像数据通过光学字符识别,得到所述待分割的图像数据中构件图形的文字位置和构件图形的文字内容的方法,包括:
从所述待分割的图像数据中提取底层特征、高层特征,并将所述底层特征、所述高层特征进行融合,得到共享特征;
通过转化所述共享特征,得到每像素的文本预测;
将文本预测中带有角度的文本块,通过仿射变换转化为正常的轴对齐的文本块;
将转化后的文本块通过共享卷积提取并由感兴趣区域转换,得到区域特征;
根据所述区域特征,得到所述待分割的图像数据中构件图形的文字位置和构件图形的文字内容。
在本申请的一些实施例中,基于以上技术方案,所述方法还包括:
将所述构件图形的文字位置与所述点云构件图形位置进行匹配以确定所述标准点云构件图形的位置偏差;
将所述构件图形的文字内容与所述标准点云构件类别进行匹配以确定标准点云构件图形的轮廓偏差;
根据所述位置偏差和所述轮廓偏差调整所述标准点云构件图形的图形轮廓和分割位置。
根据本申请实施例的一个方面,提供一种图像分割装置,包括:
点云模块,被配置为点云化处理待分割图像数据,得到点云图像数据;所述点云图像数据包括若干点云构件图形,所述点云构件图形包括标准点云构件图形;
特征提取模块:被配置为通过锚框标记和边框回归构造所述点云图像数据中与所述点云构件图形对应的点云特征,所述点云特征用于描述点云构件图形轮廓和点云构件图形位置;
特征识别模块:被配置为针对所述点云图像数据中的点云构件图形,通过预训练的机器学习模型识别所述点云特征中的点云构件图形轮廓,得到标准点云构件类别,所述标准点云构件类别用于指示所述点云构件图形归属的标准点云构件图形;
图像分割模块,被配置为以所述点云构件图形位置作为分割位置,使用所述标准点云构件图形在所述分割位置对所述点云图像数据执行分割。
在本申请的一些实施例中,基于以上技术方案,所述图像分割装置还包括模型训练模块,所述模型训练模块被配置为以点云构件图形轮廓样本为输入,以所述点云构件图形轮廓样本对应的标准点云构件类别为输出,对预构建的机器学习模型进行训练,得到预训练的机器学习模型。
在本申请的一些实施例中,基于以上技术方案,所述模型训练模块包括掩码单元,所述掩码单元被配置为
将所述点云构件图形轮廓样本通过掩码计算,通过所述掩码计算加强所述点云构件图形轮廓样本与所述标准点云构件类别的关联权重,所述关联权重用于增强所述点云构件图形轮廓样本与标准点云构件类别的关联程度;将增强与所述点云构件图形轮廓样本关联程度的所述点云构件图形轮廓样本,输入所述机器学习模型进行迭代训练,直至收敛得到对点云构件图形轮廓增强识别的机器学习模型。
在本申请的一些实施例中,基于以上技术方案,所述特征识别模块包括:
特征获取单元,被配置为利用预训练类别和偏移量标签的锚框扫描所述点云图像数据,计算所述锚框与所述真实边界框的交并比,若所述交并比大于等于交并比阈值,将所述锚框作为预测边界框;
边框回归单元,被配置为调整所述预测边界框的中心点和宽高,输出所述预测边界框的点云特征,所述点云特征包括类别和偏移量标签。
在本申请的一些实施例中,基于以上技术方案,所述图像分割装置还包括文字识别模块,所述文字识别模块被配置为将所述待分割的图像数据通过光学字符识别,得到所述待分割的图像数据中构件图形的文字位置和构件图形的文字内容。
在本申请的一些实施例中,基于以上技术方案,所述文字识别模块包括:
特征提取单元,被配置为从所述待分割的图像数据中提取底层特征、高层特征,并将所述底层特征、所述高层特征进行融合,得到共享特征;
第一转化单元,被配置为通过转化所述共享特征,得到每像素的文本预测;
第二转化单元:被配置为将文本预测中带有角度的文本块,通过仿射变换转化为正常的轴对齐的文本块;
卷积提取单元,被配置为将转化后的文本块通过共享卷积提取并由感兴趣区域转换,得到区域特征;
文字获取单元,被配置为根据所述区域特征,得到所述待分割的图像数据中构件图形的文字位置和构件图形的文字内容。
在本申请的一些实施例中,基于以上技术方案,所述图像分割装置还包括修正模块,所述修正模块包括:
位置匹配单元,所述位置匹配单元被配置为将所述构件图形的文字位置与所述点云构件图形位置进行匹配以确定所述标准点云构件图形的位置偏差;
轮廓匹配单元,所述轮廓匹配单元被配置为将所述构件图形的文字内容与所述标准点云构件类别进行匹配以确定标准点云构件图形的轮廓偏差;
调整修正单元,所述调整修正单元被配置为根据所述位置偏差和所述轮廓偏差调整所述标准点云构件图形的图形轮廓和分割位置。
根据本申请实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的图像分割方法。
根据本申请实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器被配置为经由执行所述可执行指令来执行如以上技术方案中的图像分割方法。
根据本申请实施例的一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上技术方案中的图像分割方法。
在本申请实施例提供的技术方案中,本申请通过将待分割图像数据点云化处理后,通过锚框标记和边框回归构造点云特征,利用点云特征来描述待分割图像数据中复杂的图形构件,其中点云特征用于描述点云构件图形轮廓和点云构件图形位置;然后通过预训练的机器学习模型识别出点云构件图形轮廓对应的标准点云构件类别,根据标准点云构件类别确定标准点云构件图形,最后以所述点云构件图形位置作为分割位置,使用所述标准点云构件图形在所述分割位置对所述点云图像数据执行分割。由于本申请对应的分割位置是精确得到的点云构件图形位置,分割的轮廓是通过预训练的机器学习模型识别后确定好的标准点云构件图形,因此,本申请进行分割时,分割准确率高,能够将待分割图像数据中标准的图形构件分割出来,而且,本申请只需要获取到点云构件图形位置和标准点云构件图形就可以对将待分割图像数据进行精确分割,分割效率高,有利于图像分割的推广应用。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性地示出了应用本申请技术方案的示例性***架构框图。
图2示意性地示出了本申请图像分割方法的流程图。
图3示意性地示出了本申请点云特征构造方法的流程图。
图4为本申请实施例提供的边缘轮廓进行多边形拟合处理的原理图。
图5示意性地示出了本申请图像分割调整方法的流程图。
图6示意性地示出了本申请图像分割装置的结构框图。
图7示意性地示出了本申请文字识别模块的结构框图。
图8示意性地示出了本申请修正模块的结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图像分割方法可以分为两大类,分别是基于检测的和无检测的。基于检测的图像分割方法可以很好地处理随机实例标签和不规则数量的实例,通过使用检测分支来屏蔽不同的对象。但是,该方法不能确保每个点的标签一致,因为一个点可以获得多个实例标签或者没有标签,这取决于包含它的分段区域的数量,因此,存在分割不精确的问题。另一方面,基于无检测的分割方法利用额外的分组步骤,需要侧步排序和不规则数量的实例,例如使用mean-shift(均值偏移)算法。额外的分组步骤通常依赖于超参数设置,如群集带,以获得良好的性能,因此,效率极低,训练成本高。此外,以上两种方法通常优化代理目标而不是实例分割,例如分别最小化或最大化同一实例或两个不同实例的点之间的嵌入特征距离。因此,在训练目标和最终实例分割之间存在差距,存在分割准确性差的问题。
本申请为了解决以上的问题,提出了一种图像分割方法、图像分割装置、计算机可读介质以及电子设备。下面将进一步对本申请的各个方面进行描述说明。
图1示意性地示出了应用本申请技术方案的示例性***架构框图。
如图1所示,***架构100可以包括终端设备110、网络120和服务器130。终端设备110可以包括智能手机、平板电脑、笔记本电脑、台式电脑等各种电子设备。服务器130可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云计算服务的云服务器。网络120可以是能够在终端设备110和服务器130之间提供通信链路的各种连接类型的通信介质,例如可以是有线通信链路或者无线通信链路。
根据实现需要,本申请实施例中的***架构可以具有任意数目的终端设备、网络和服务器。例如,服务器130可以是由多个服务器设备组成的服务器群组。另外,本申请实施例提供的技术方案可以应用于终端设备110,也可以应用于服务器130,或者可以由终端设备110和服务器130共同实施,本申请对此不做特殊限定。
以上部分介绍了应用本申请技术方案的示例性***架构的内容,接下来具体介绍图像分割方法的具体内容。
根据本申请实施例的一个方面,提供一种图像分割方法,图2示意性地示出了本申请图像分割方法的流程图,如图2所示,包括步骤S210-步骤S240。
在步骤S210中:点云化处理待分割图像数据,得到点云图像数据;点云图像数据包括若干点云构件图形,点云构件图形包括标准点云构件图形。
其中,待分割图像数据包括二维图像数据和三维图像数据,待分割图像数据直接来自于图纸,而图纸可以是CAD图纸,或者是其它图形处理软件例如solidworks、proe或CorelDraw的图纸。将图纸对应的文件作为待分割图像数据上传,然后读入图纸内容,再进行点云化处理。
点云是在同一空间参考系下表达目标空间分布和目标表面特性的海量点集合,在获取物体表面每个采样点的空间坐标后,得到的是点的集合,将每个采样点的坐标集合称之为“点云”。点云的获取设备可以是深度相机设备,也可以利用微软的Kinect设备或者华硕的XTionPRO设备。深度相机设备通过近红外激光器,将具有一定结构特征的光线投射到被拍摄物体上,再由专门的红外摄像头进行采集。这种具备一定结构的光线,会因被摄物体的不同深度区域,而采集不同的图像相位信息,然后通过运算单元将这种结构的变化换算成深度信息,以此来获得三维结构。
而本申请通过将待分割图像数据通过深度相机设备实现各个坐标位置转换成点云处理,实现了将待分割图像数据点云化,得到了点云图像数据。待分割图像数据是由许多的构件图形组成的,例如,一个城市规划图的图纸,包括了大楼,街道,树木等等的构件图形。而将将待分割图像数据点云化后的点云图像数据包括了若干点云构件图形,点云构件图形是原先的构件图形点云化后的效果。而在若干点云构件图形中又包括了标准点云构件图形。标准点云构件图形是需要从图形中分割出的常用的图形点云化后的结果,例如,以城市规划图为例,经常需要分割的构件图形包括大楼图形,街道图形,树木图形等,将这些图形点云化处理后作为标准点云构件图形。而以教室的图纸为例,经常需要分割的图像包括课桌图形,椅子图形和讲台图形,将这些图形点云化处理就可以得到标准点云构件图形。而点云构件图形除了标准点云构件图形外,还可以包括一些非标准点云构件图形,例如,城市规划图的图纸中的草地,两栋大楼之间的空白区域等等,这些图形通过点云化处理后就会构成非标准点云构件图形。而对于分割工作来说,一般需要将标准点云构件图形分割出来,而对于非标准点云构件图形一般需要予以排除。
以上部分介绍了点云图像数据的构成和获得方式,接下来具体介绍分割方法。
在步骤S220中:通过锚框标记和边框回归构造点云图像数据中与点云构件图形对应的点云特征,点云特征用于描述点云构件图形轮廓和点云构件图形位置。
对点云图像数据进行目标检测和识别方法有很多种,本申请为了能快速获取到点云图像数据中的点云特征,同时减小运算量,利用的是锚框标记和边框回归的方法。下面具体说明本申请获得点云特征的具体方法。
在本申请的一个实施例中,如图3所示,图3示意性地示出了本申请点云特征的构造方法的流程图。点云图像数据包括点云构件图形的真实边界框,通过锚框标记和边框回归构造点云图像数据中与点云构件图形对应的点云特征的方法,包括步骤S310-步骤S320。
步骤S310:利用预训练类别和偏移量标签的锚框扫描点云图像数据,计算锚框与所述真实边界框的交并比,若交并比大于等于交并比阈值,将锚框作为预测边界框。
在说明锚框之前,需要解释下边界框的概念,在目标检测里,通常使用边界框来描述目标位置。边界框可以是一个矩形框,由矩形左上角的坐标与右下角的坐标确定。当然,当识别的物体较为复杂时,例如,识别建筑物的墙体结构时,可以使用多边形作为边界框,当边界框是多边形时,可以通过多边形各个边对应的顶点坐标来确定。
在进行目标检测和识别过程中,需要利用区域采样方法采集点云图像数据,从而识别出点云图像数据中包含的一些图形构件,本申请使用的区域采样方法是利用一个边界框作为一个区域,通过边界框识别点云图像数据中包含的一些图形构件,并调整区域边缘从而更准确地预测目标的真实边界框,对于图形构件而言,都存在确定好的边界框,例如,对于瓶子边界框是椭圆形,桌面边界框是圆形,墙体边界框是矩形或多边形等。而本申请是以点云图像数据中的每个像素为中心生成多个大小和宽高比不同的边界框。这些边界框被称为锚框(anchor box),即该锚框是用来识别点云图像数据中存在的图形构件所预先得到的大小和宽高比不同的边界框。
而锚框标记的步骤包括锚框训练和锚框预测的过程。预训练类别和偏移量标签的锚框就是对应的锚框训练的过程。锚框训练是在训练集中,将每个锚框视为一个训练样本。为了训练锚框标记模型,我们需要为每个锚框标注两类标签:一是锚框所含目标的类别,简称类别,例如对于一个楼层规划图而言,墙体、楼梯和地板都对应的类别;二是真实边界框相对锚框的偏移量,简称偏移量。因此,经过锚框训练后,所有的锚框都会标注两类标签,即类别和偏移量。通过锚框训练,就能够生成许多大小和宽高比不同的锚框。而训练完成后就需要进行锚框预测,锚框预测的过程就是得到点云图像数据中点云特征的过程。
锚框预测是利用锚框扫描点云图像数据,计算锚框与真实边界框的交并比,若交并比大于等于交并比阈值,将锚框作为预测边界框;
具体的,锚框预测是通过锚框训练生成的多个锚框扫描点云图像数据,而点云图像数据中包含了许多点云构件图形的真实边界框,利用多个锚框与真实边界框进行扫描覆盖,计算交并比,并判断交并比是否大于设定的交并比阈值,若大于设定的交并比阈值就将该锚框作为对应点云构件图形的预测边界框。其中,交并比是任意一个锚框与真实边界框的交集面积与并集面积的比值,而交并比阈值一般设置为0.5。举例说明,在楼层规划图对应的点云图像数据中存在墙体对应的点云构件图形,而点云图像数据中也能获得墙体对应的真实边界框。此时通过众多的锚框扫描识别,如果某一个锚框与墙体的真实边界框的交并比大于0.5,那么就可以将该锚框作为该墙体的预测边界框。
在对点云图像数据进行目标识别时,在点云图像中生成多个锚框,我们根据锚框及其预测偏移量得到预测边界框。由于阈值和锚框数量选择的问题,同一个目标可能会输出多个相似的预测边界框,这样不仅不简洁,而且会增加计算量,为了解决这个问题,本申请使用非极大值抑制,对于一个预测边界框,模型最终会输出计算它属于每个类别的概率值,其中概率值最大对应的类别就是预测边界框的类别。在同一副图像上,把所有预测边界框(不区分类别)的预测概率从大到小进行排列,然后取出最大概率的预测边界框作为基准,然后计算剩余的预测边界框与真实边界框的交并比,如果大于给定的某个阈值,则将这个预测边界框移除。这样的话保留了概率最大的预测边界框并移除了其他与其相似的边界框。然后再从剩余的预测边界框中选出概率值最大的预测边界框。
当得出预测边界框后,还可以通过损失函数来评价预测边界框和真实边界框不一样的程度,若两者相差较大,可以将该锚框排除,从而重新进行步骤S310。而本申请可以利用交叉熵损失函数,也可以利用其它损失函数。
通过以上方法得到预测边界框之后,由于锚框数量有限,因此预测边界框与真实边界框还是存在差距,这时可以利用边框回归的方法调整预测边界框,具体如步骤S320。
步骤S320:调整预测边界框的中心点和宽高,输出预测边界框的点云特征,点云特征包括类别和偏移量标签。
该步骤对应的就是边框回归和得到点云特征的步骤,具体的步骤是通过调整预测边界框的中心点和宽高来进一步调节与真实边界框的差距,从而实现预测边界框能够更准确的表示点云构件图形,当得到预测边界框之后,通过预测边界框的偏移量就可以得到点云构件图形位置,通过预测边界框的类别就可以得到点云构件图形轮廓。例如,通过预测边界框得到对应的类别是墙体,对应的偏移量是(1,2,3),那么点云构件图形轮廓对应的就是预测边界框的轮廓,点云构件图形的位置对应的就是预测边界框的位置按坐标系偏移(-1,-2,-3)之后的位置。因此,利用以上方法就可以构造出云图像数据中与点云构件图形对应的点云特征,得到点云构件图形轮廓和点云构件图形位置。
本申请利用锚框标记和边框回归的方式进行目标检测和识别,利用大小和宽高比的锚框来对图像进行轮廓特征提取,能够快速获取到点云图像数据中的点云特征,而不需要获得点云图像数据中图形构件的详细轮廓,解决了点云特征的获取效率的问题。而且,由于锚框整体外形简单,利用锚框进行检测和识别也能够有效的减小目标检测和识别时的运算量,避免复杂轮廓导致运算量增加的问题。
当得到点云构件图形轮廓即预测边界框的轮廓之后,有可能其轮廓存在不清晰或者断开的情况,因此,本申请还可以对预测边界框进行轮廓拟合,得到与点云构件图形对应的点云构件图形轮廓。
具体的,通过轮廓检测算法,即可得到点云构件图形的轮廓。本申请的点云构件图形包括墙体;当点云构建图形是墙体时,将建筑构件进行轮廓拟合,包括:
对墙体的轮廓进行边缘轮廓提取;基于边缘轮廓进行多边形拟合处理,从拟合的多边形得到处理后的墙体轮廓。
具体的,对轮廓进行多边形拟合采用的是一种迭代端点的拟合方法,在该拟合算法中,迭代次数越多,对轮廓的拟合精度就越高,拟合后的轮廓线就越接近原始轮廓线。请参阅图4,图4为本申请实施例提供的边缘轮廓进行多边形拟合处理的原理图。该拟合算法拟合一条轮廓的主要步骤如下:
(1)设置一个距离阈值T;
(2)选取轮廓线的起始点A和终止点B为拟合多边形的两个端点;
(3)计算在轮廓线AB上A、B两点间所有点到A、B连线的距离,选出这其中距离最大点C,并设此最大距离值为H;
(4)比较H和T,如果H>T,说明C是拟合多边形的一个端点,继续步骤(5);如果H<T,则跳出算法,说明该段轮廓线上不存在端点;
(5)端点C将轮廓线AB分为AC和BC两部分,按照(2)、(3)、(4)、(5)步骤,分别找出这两部分轮廓线上的端点;依此找出曲线AB上所有端点(A、B、C、D……),将它们按照顺序连接起来,即获得最后拟合的多边形,端点A、B、C、D……即为多边形顶点。
确定了多边形顶点就确定了预测边界框的轮廓,也就确定了点云构件图形的轮廓。
当得到了点云构件图形对应的点云特征之后,还不能直接进行分割,因为对应的点云构件图形包括了很多类型的图形,其中就有标准点云构件图形和非标准点云构件图形,而对于非标准点云构件图形是不需要进行分割的,因此,还需要通过具体的步骤将非标准点云构件图像排除,而在实际使用时,排除的另一个思路就是挑选出标准点云构件图形的过程。具体的方法如步骤S230。
在步骤S230中:针对点云图像数据中的点云构件图形,通过预训练的机器学习模型识别点云特征中的点云构件图形轮廓,得到标准点云构件类别,标准点云构件类别用于指示点云构件图形归属的标准点云构件图形。
在进行本申请步骤S230之前,还需要先进行训练,得到机器学习模型,具体的方法是:
以点云构件图形轮廓样本为输入,以点云构件图形轮廓样本对应的标准点云构件类别为输出,对预构建的机器学习模型进行训练,得到预训练的机器学习模型。
点云构件图形轮廓样本对应的就是步骤S220中得到的多组预测边界框的轮廓样本,是由不同的长宽比例以及中心点不同的预测边界框组成。而标准点云构件类别指的是预先确定好需要进行分割的标准构建名称,在本申请的点云图像数据中,目标检测算法往往对于点云图像数据所包含的图形构件的物体有一定先验知识,因此可以通过将物体的边界框特征转换为参数点云参数的形式,从而可以准确框住目标。例如对于桌面或墙面多半是大平面,桌上的罐子应该是圆柱体,长方体的盒子可能是牛奶盒等,而对于复杂场景中的物体,其几何外形可以归结于简单的几何形状。因此,本申请在标准点云构件类别时,预先确定了对应的预测边界框的轮廓。例如,对于小区规划图中,只需要分割出房屋,树木这些图形时,就可以以房屋,树木作为标准构件,对应的标准点云构件类别就是房屋和树木。对于房屋设计图来说,如果只需要分割墙体和地板,就可以将墙体和地板作为标准构件,对应的标准点云构件类别就是墙体和地板。而对于墙体和地板的图形轮廓是通过点云构件图形轮廓样本进行训练得到的,因此,通过机器学习模型就可以将一种未知的点云构件图形轮廓输入而得出对应的标准点云构件类别,而如果输入的是非标准点云构件图形轮廓,那么自然就不会输出标准点云构件类别,本申请利用该方法将非标准点云构件排除,实现只对标准点云构件进行分割的效果。
在实际的机器学习模型预训练的过程中,为了加强点云构件图形轮廓与标准点云构件类别的关联关系,在本申请的一个实施例中,本申请还加入了掩码计算的方式,本申请将点云构件图形轮廓样本通过掩码计算,通过掩码计算加强点云构件图形轮廓样本与标准点云构件类别的关联权重,关联权重用于增强点云构件图形轮廓样本与标准点云构件类别的关联程度;将增强与点云构件图形轮廓样本关联程度的点云构件图形轮廓样本,输入机器学习模型进行迭代训练,直至收敛得到对点云构件图形轮廓增强识别的机器学习模型。利用掩码计算的步骤可以省略权重计算,从而无需设置权重,从而进一步加强图形轮廓样本与标准点云构件类别的关联程度,有利于基于输入图形轮廓样本的标准点云构件类别的输出。
当得到标准点云构件类别后,标准点云构件类别用于指示点云构件图形归属的标准点云构件图形,因此,就可以基于标准点云构件图形进行分割。一般对于标准点云构件图形和类别是预先设定好的,例如,对于墙体类别而言,其标准点云构件图形是有固定的轮廓,因此,分割时,基于该标准点云构件图形对应的轮廓进行分割即可。具体的分割方法如步骤S240。
在步骤S240中:以点云构件图形位置作为分割位置,使用标准点云构件图形在分割位置对点云图像数据执行分割。
该步骤是具体的分割过程,分割的方法是以点云构件图形位置作为分割位置,即以步骤S220得到的预测边界框的偏移量来确定分割的位置,例如偏移量是(1,2,3),点云构件图形的位置对应的就是预测边界框的位置按坐标系偏移(-1,-2,-3)之后的位置。使用标准点云构件图形在分割位置对点云图像数据执行分割。标准点云构件图形即步骤S230中根据标准点云构件类别得到的预先确定好的轮廓,基于该轮廓对点云图像数据执行分割,就可以实现精确的对点云图像数据执行分割。而且,对于所有点云图像数据的分割都只需要获得点云构件图形位置和标准点云构件图形即可,有效的提高了分割的效率。
以上部分介绍了本申请对点云图像数据进行图形分割的步骤,然而,待分割的图像并不只包含图纸,还包括里面标注的一些文字,因此,本申请可以对图纸中的文字进行识别,得出对应的文字内容。在本申请的一个实施例中,本申请的图像分割方法还包括:
将待分割的图像数据通过光学字符识别,得到待分割的图像数据中构件图形的文字位置和构件图形的文字内容。
待分割的图像中包含了图形还包含了一些文字标注,而文字标注的内容一般是与构件图形相互对应的,例如,以房屋规划图对应的CAD图纸为例,图中包括墙体,地板和横梁等图形,而一般也会标注这些图形对应的文字,而文字的内容对应的就是该构件图形的内容,而文字位置可以通过标准的标注方式,例如都以构件图形的中心位置作为标注引出位置,那么通过文字位置就可以确定构件图形的一个位置。因此,将待分割的图像数据通过光学字符识别,得到待分割的图像数据中构件图形的文字位置和构件图形的文字内容。
而本申请对于文字识别的具体方法如下:在本申请的一个实施例中,将待分割的图像数据通过光学字符识别,得到待分割的图像数据中构件图形的文字位置和构件图形的文字内容的方法,包括:
从待分割的图像数据中提取底层特征、高层特征,并将底层特征、高层特征进行融合,得到共享特征;
具体的,通过文字识别技术能够找到文本在待分割的图像数据中的位置并识别,即面向于待分割的图像数据上绘制的构件图形,找到构件图形的名称信息在待分割的图像数据中的位置,进而对此位置上的文本加以识别获得构件图形的名称信息。
其中,文字识别技术可以是OCR(Optical Character Recognition,光学字符识别)技术,OCR技术通过扫描等光学输入方式将待分割的图像数据上附带的文本转化为图像信息,再将图像信息转化为可以使用的计算机输入技术。
识别待分割的图像数据上附带的文本,得到构件图形的名称信息,包括:通过将待分割的图像数据每一像素进行的文本预测,对待分割的图像数据上附带的文本获得对应的文本块,识别文本块得到所述构件图形的名称信息。
示例性的,通过将待分割的图像数据每一像素进行的文本预测,对待分割的图像数据上附带的文本获得对应的文本块,识别文本块得到所述构件图形的名称信息,包括以下步骤:
从建筑构件中提取底层特征、高层特征,并将底层特征、高层特征进行融合,得到共享特征;其中,图像底层特征指的是:轮廓、边缘、颜色、纹理和形状特征;图像的高层特征值得是我们所能看的东西。示例性的,对一张人脸提取低层特征,则提取到脸的轮廓、鼻子、眼睛之类的,那么高层特征就显示为一张人脸。
通过转化共享特征,得到每像素的文本预测;
将文本预测中带有角度的文本块,通过仿射变换转化为正常的轴对齐的文本块;
将转化后的文本块通过共享卷积提取并由感兴趣区域转换,得到区域特征;
根据区域特征,得到待分割的图像数据中构件图形的文字位置和构件图形的文字内容。
通过以上步骤识别出待分割的图像数据中构件图形的文字位置和构件图形的文字内容后,就可以利用以上内容对图像分割进行调整。图5示意性地示出了本申请图像分割调整方法的流程图。如图5所示,图像分割调整方法的包括步骤S510-步骤S530。
步骤S510:将构件图形的文字位置与点云构件图形位置进行匹配以确定标准点云构件图形的位置偏差.
通过步骤S220获得了待分割的图像数据中不同点云构件图形位置,而其对应的是预测边界框的偏移量,而获得的构件图形的文字位置可以根据文字标注的规范,例如文字标注时都以构件图形的中心点作为标注点,那么,通过构件图形的文字位置就可以获取到构件图形的中心点位置,然后将构件图形的中心点位置与预测边界框的偏移量对应的中心点进行匹配,就可以确定步骤S220得到的构件图形的文字位置的位置偏差。例如,通过构件图形的文字位置确定该构件图形的中心点坐标是(1,2,3),通过点云构件图形位置确定的偏移量也是(-1,-2,-3),那么通过偏移量确定的该构件图形的中心点也是(1,2,3),此时两者是重合的,说明点云构件图形位置是相对准确的。如果出现两者误差较大的情况,就说明此时点云构件图形位置存在一定的位置偏差因此,还可以通过该位置偏差调整对应的位置。
步骤S520:将构件图形的文字内容与标准点云构件类别进行匹配以确定标准点云构件图形的轮廓偏差。
该步骤具体通过对比构件图形的文字内容与步骤S230得到的标准点云构件类别,构件图形的文字内容是对构件的具体标注信息,例如,对于房屋规划图来说,可能标注的是墙体,横梁,地板等信息。而本申请步骤S230得到的标准点云构件类别对应的也是是墙体,横梁,地板等信息,因此,通过两者进行匹配,就可以确定标准点云构件类别是否正确,从而可以确定轮廓的偏差,如果两者差距较大,那么就需要对标准点云构件类别进行调整,例如将标准点云构件类别替换成构件图形的文字内容。
步骤S530:根据位置偏差和轮廓偏差调整标准点云构件图形的图形轮廓和分割位置。
该步骤具体就是根据步骤S510和步骤S520得到的位置偏差和轮廓偏差对标准点云构件图形的图形轮廓和分割位置进行调整,具体的调整可以是调整点云构件图形位置或者调整标准点云构件类别,以实现更加精确的分割。
本申请利用以上方法执行图像分割之后,还可以对分割后的图像进行降重叠处理,具体降重叠的方法可以通过使用opnecv python编程语言在anaconda软件环境下预先设置好的工具函数进行降重叠。而判断是否重叠的方式可以通过相交,相交比例,相干涉,正对,曼哈顿距离和斜率来计算,然后利用对应的工具函数进行降重叠。
例如判定矩形是否正对,两个矩形是否正对是指一个方向看其中一个刚好能够完全遮挡另外一个。首先使用干涉函数获得最大最小的x,y坐标,再通过对角线斜率判断方位。判断是否存在干涉,如果有,则进一步判断是否是正面相干涉(干涉指两者之间相对某一平行于矩形边方向存在投影重叠关系),若符合正面相干涉,则判定两目标存在正对关系。(这是对规则要求的抽象简化,比如厕所门不能正对床头,在我们的模型中,转化成了两个矩形是否正对的关系,这是一个特殊的情况,只有在干涉存在的时候才需要进一步判断),具体判断矩形是否正对的伪代码如下:
干涉函数(左上角坐标1,右下角坐标1,左上角坐标2,右下角坐标2):
转换出八个最大最小x,y值;
If(两个矩形相交,就是有重叠)返回True,表示有干涉;
elif两个不相干涉的情况返回False,表示没有干涉;
else返回True,表示有干涉;
正对函数(左上角坐标1,右下角坐标1,左上角坐标2,右下角坐标2);
求出四个点的曼哈顿距离,if正面的左上角点最近:返回True存在正对关系;
Else:返回False不存在正对关系。
因此,根据以上方法就可以实现对分割后的图像数据进行降重叠,从而进一步提高分割的效果,从而实现将图像数据中的图形分而治之,突出重点,单独处理的目的。
以上部分介绍了本申请图像分割方法的具体方案。接下来具体介绍本申请其它方面的内容。
根据本申请实施例的一个方面,如图6所示,图6示意性地示出了本申请图像分割装置的结构框图。本申请提供一种图像分割装置600,包括:
点云模块610,被配置为点云化处理待分割图像数据,得到点云图像数据;点云图像数据包括若干点云构件图形,点云构件图形包括标准点云构件图形;
特征提取模块620:被配置为通过锚框标记和边框回归构造点云图像数据中与点云构件图形对应的点云特征,点云特征用于描述点云构件图形轮廓和点云构件图形位置;
特征识别模块630:被配置为针对点云图像数据中的点云构件图形,通过预训练的机器学习模型识别点云特征中的点云构件图形轮廓,得到标准点云构件类别,标准点云构件类别用于指示点云构件图形归属的标准点云构件图形;
图像分割模块640,被配置为以点云构件图形位置作为分割位置,使用标准点云构件图形在分割位置对点云图像数据执行分割。
在本申请的一个实施例中,本申请的图像分割装置还包括模型训练模块650,模型训练模块650被配置为以点云构件图形轮廓样本为输入,以点云构件图形轮廓样本对应的标准点云构件类别为输出,对预构建的机器学习模型进行训练,得到预训练的机器学习模型。
在本申请的一个实施例中,基于以上技术方案,模型训练模块650包括掩码单元,掩码单元被配置为将点云构件图形轮廓样本通过掩码计算,通过掩码计算加强点云构件图形轮廓样本与标准点云构件类别的关联权重,关联权重用于增强点云构件图形轮廓样本与标准点云构件类别的关联程度;将增强与点云构件图形轮廓样本关联程度的点云构件图形轮廓样本,输入机器学习模型进行迭代训练,直至收敛得到对点云构件图形轮廓增强识别的机器学习模型。
在本申请的一个实施例中,基于以上技术方案,特征识别模块630包括:
特征获取单元,被配置为利用预训练类别和偏移量标签的锚框扫描点云图像数据,计算锚框与真实边界框的交并比,若交并比大于等于交并比阈值,将锚框作为预测边界框;
边框回归单元,被配置为调整预测边界框的中心点和宽高,输出预测边界框的点云特征,点云特征包括类别和偏移量标签。
在本申请的一个实施例中,基于以上技术方案,图像分割装置还包括文字识别模块660,文字识别模块660被配置为将待分割的图像数据通过光学字符识别,得到待分割的图像数据中构件图形的文字位置和构件图形的文字内容。
在本申请的一个实施例中,基于以上技术方案,如图7所示,图7示意性地示出了本申请文字识别模块的结构框图。文字识别模块660包括:
特征提取单元710,被配置为从待分割的图像数据中提取底层特征、高层特征,并将底层特征、高层特征进行融合,得到共享特征;
第一转化单元720,被配置为通过转化共享特征,得到每像素的文本预测;
第二转化单元730:被配置为将文本预测中带有角度的文本块,通过仿射变换转化为正常的轴对齐的文本块;
卷积提取单元740,被配置为将转化后的文本块通过共享卷积提取并由感兴趣区域转换,得到区域特征;
文字获取单元750,被配置为根据区域特征,得到待分割的图像数据中构件图形的文字位置和构件图形的文字内容。
在本申请的一个实施例中,基于以上技术方案,图像分割装置还包括修正模块670,如图8所示,图8示意性地示出了本申请修正模块的结构框图。修正模块670包括:
位置匹配单元810,位置匹配单元被配置为将构件图形的文字位置与点云构件图形位置进行匹配以确定标准点云构件图形的位置偏差;
轮廓匹配单元820,轮廓匹配单元被配置为将构件图形的文字内容与标准点云构件类别进行匹配以确定标准点云构件图形的轮廓偏差;
调整修正单元830,调整修正单元被配置为根据位置偏差和轮廓偏差调整标准点云构件图形的图形轮廓和分割位置。
本申请各实施例中提供的图像分割装置的具体细节已经在对应的方法实施例中进行了详细的描述,此处不再赘述。
以上介绍了本申请图像分割装置的具体内容,接下来继续介绍本申请其它方面内容。
根据本申请实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的图像分割方法。
根据本申请实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器被配置为经由执行可执行指令来执行如以上技术方案中的图像分割方法。
根据本申请实施例的一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上技术方案中的图像分割方法。
在本申请实施例提供的技术方案中,本申请通过将待分割图像数据点云化处理后,通过锚框标记和边框回归构造点云特征,利用点云特征来描述待分割图像数据中复杂的图形构件,其中点云特征用于描述点云构件图形轮廓和点云构件图形位置;然后通过预训练的机器学习模型识别出点云构件图形轮廓对应的标准点云构件类别,根据标准点云构件类别确定标准点云构件图形,最后以所述点云构件图形位置作为分割位置,使用所述标准点云构件图形在所述分割位置对所述点云图像数据执行分割。由于本申请对应的分割位置是精确得到的点云构件图形位置,分割的轮廓是通过预训练的机器学习模型识别后确定好的标准点云构件图形,因此,本申请进行分割时,分割准确率高,能够将待分割图像数据中标准的图形构件分割出来,而且,本申请只需要获取到点云构件图形位置和标准点云构件图形就可以对将待分割图像数据进行精确分割,分割效率高,有利于图像分割的推广应用。
应当注意,尽管在附图中以特定顺序描述了本申请中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (8)
1.一种图像分割方法,其特征在于,包括:
点云化处理待分割图像数据,得到点云图像数据;所述点云图像数据包括若干点云构件图形和所述点云构件图形的真实边界框,所述点云构件图形包括标准点云构件图形;
利用预训练类别和偏移量标签的锚框扫描所述点云图像数据,计算所述锚框与所述真实边界框的交并比,若所述交并比大于等于交并比阈值,将所述锚框作为预测边界框;调整所述预测边界框的中心点和宽高,输出所述预测边界框的点云特征,所述点云特征包括类别和偏移量标签,所述点云特征用于描述点云构件图形轮廓和点云构件图形位置;
针对所述点云图像数据中的点云构件图形,通过预训练的机器学习模型识别所述点云特征中的点云构件图形轮廓,得到标准点云构件类别,所述标准点云构件类别用于指示所述点云构件图形归属的标准点云构件图形,所述预训练的机器学习模型以所述点云构件图形轮廓样本为输入,以所述点云构件图形轮廓样本对应的标准点云构件类别为输出,对预构建的机器学习模型进行训练得到;
以所述点云构件图形位置作为分割位置,使用所述标准点云构件图形在所述分割位置对所述点云图像数据执行分割。
2.根据权利要求1所述的图像分割方法,其特征在于,以点云构件图形轮廓样本为输入,以所述点云构件图形轮廓样本对应的标准点云构件类别为输出,对预构建的机器学习模型进行训练,包括:
将所述点云构件图形轮廓样本通过掩码计算,通过所述掩码计算加强所述点云构件图形轮廓样本与所述标准点云构件类别的关联权重,所述关联权重用于增强所述点云构件图形轮廓样本与标准点云构件类别的关联程度;
将增强与所述点云构件图形轮廓样本关联程度的所述点云构件图形轮廓样本,输入所述机器学习模型进行迭代训练,直至收敛得到对点云构件图形轮廓增强识别的机器学习模型。
3.根据权利要求1所述的图像分割方法,其特征在于,所述方法还包括:
将所述待分割的图像数据通过光学字符识别,得到所述待分割的图像数据中构件图形的文字位置和构件图形的文字内容。
4.根据权利要求3所述的图像分割方法,其特征在于,将所述待分割的图像数据通过光学字符识别,得到所述待分割的图像数据中构件图形的文字位置和构件图形的文字内容,包括:
从所述待分割的图像数据中提取底层特征、高层特征,并将所述底层特征、所述高层特征进行融合,得到共享特征;
通过转化所述共享特征,得到每像素的文本预测;
将文本预测中带有角度的文本块,通过仿射变换转化为正常的轴对齐的文本块;
将转化后的文本块通过共享卷积提取并由感兴趣区域转换,得到区域特征;
根据所述区域特征,得到所述待分割的图像数据中构件图形的文字位置和构件图形的文字内容。
5.根据权利要求3所述的图像分割方法,其特征在于,所述方法还包括:
将所述构件图形的文字位置与所述点云构件图形位置进行匹配以确定所述标准点云构件图形的位置偏差;
将所述构件图形的文字内容与所述标准点云构件类别进行匹配以确定标准点云构件图形的轮廓偏差;
根据所述位置偏差和所述轮廓偏差调整所述标准点云构件图形的图形轮廓和分割位置。
6.一种图像分割装置,其特征在于,包括:
点云模块,被配置为点云化处理待分割图像数据,得到点云图像数据;所述点云图像数据包括若干点云构件图形和所述点云构件图形的真实边界框,所述点云构件图形包括标准点云构件图形;
特征提取模块:被配置为利用预训练类别和偏移量标签的锚框扫描所述点云图像数据,计算所述锚框与所述真实边界框的交并比,若所述交并比大于等于交并比阈值,将所述锚框作为预测边界框;调整所述预测边界框的中心点和宽高,输出所述预测边界框的点云特征,所述点云特征包括类别和偏移量标签,所述点云特征用于描述点云构件图形轮廓和点云构件图形位置;
特征识别模块:被配置为针对所述点云图像数据中的点云构件图形,通过预训练的机器学习模型识别所述点云特征中的点云构件图形轮廓,得到标准点云构件类别,所述标准点云构件类别用于指示所述点云构件图形归属的标准点云构件图形,所述预训练的机器学习模型以所述点云构件图形轮廓样本为输入,以所述点云构件图形轮廓样本对应的标准点云构件类别为输出,对预构建的机器学习模型进行训练得到;
图像分割模块,被配置为以所述点云构件图形位置作为分割位置,使用所述标准点云构件图形在所述分割位置对所述点云图像数据执行分割。
7.一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1至5中任意一项所述的图像分割方法。
8.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至5中任意一项所述的图像分割方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110939617.XA CN113658195B (zh) | 2021-08-16 | 2021-08-16 | 图像分割方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110939617.XA CN113658195B (zh) | 2021-08-16 | 2021-08-16 | 图像分割方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113658195A CN113658195A (zh) | 2021-11-16 |
CN113658195B true CN113658195B (zh) | 2024-03-19 |
Family
ID=78491681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110939617.XA Active CN113658195B (zh) | 2021-08-16 | 2021-08-16 | 图像分割方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113658195B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114494764A (zh) * | 2021-12-21 | 2022-05-13 | 上海品览数据科技有限公司 | 一种建筑专业平面楼梯大样图中楼梯构件的识别方法 |
CN115205717B (zh) * | 2022-09-14 | 2022-12-20 | 广东汇天航空航天科技有限公司 | 障碍物点云数据处理方法以及飞行设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111681274A (zh) * | 2020-08-11 | 2020-09-18 | 成都艾尔帕思科技有限公司 | 基于深度相机点云数据的3d人体骨骼识别和提取方法 |
CN112233181A (zh) * | 2020-10-29 | 2021-01-15 | 深圳市广宁股份有限公司 | 6d位姿识别的方法、装置及计算机存储介质 |
CN112508975A (zh) * | 2020-12-21 | 2021-03-16 | 上海眼控科技股份有限公司 | 一种图像识别方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108198145B (zh) * | 2017-12-29 | 2020-08-28 | 百度在线网络技术(北京)有限公司 | 用于点云数据修复的方法和装置 |
-
2021
- 2021-08-16 CN CN202110939617.XA patent/CN113658195B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111681274A (zh) * | 2020-08-11 | 2020-09-18 | 成都艾尔帕思科技有限公司 | 基于深度相机点云数据的3d人体骨骼识别和提取方法 |
CN112233181A (zh) * | 2020-10-29 | 2021-01-15 | 深圳市广宁股份有限公司 | 6d位姿识别的方法、装置及计算机存储介质 |
CN112508975A (zh) * | 2020-12-21 | 2021-03-16 | 上海眼控科技股份有限公司 | 一种图像识别方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
面向三维模型分割的边界感知点云神经网络;关柏良;周凡;林淑金;罗笑南;;计算机辅助设计与图形学学报(01);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113658195A (zh) | 2021-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10726599B2 (en) | Realistic augmentation of images and videos with graphics | |
Lv et al. | Residential floor plan recognition and reconstruction | |
CN113657390A (zh) | 文本检测模型的训练方法和检测文本方法、装置和设备 | |
CN113592886B (zh) | 建筑图纸的审图方法、装置、电子设备及介质 | |
CN110502985B (zh) | 表格识别方法、装置及表格识别设备 | |
CN110414502B (zh) | 图像处理方法及装置、电子设备和计算机可读介质 | |
CN113658195B (zh) | 图像分割方法、装置及电子设备 | |
Sohn et al. | An implicit regularization for 3D building rooftop modeling using airborne lidar data | |
KR102211763B1 (ko) | 글자 검출 장치, 방법 및 시스템 | |
CN112418216A (zh) | 一种复杂自然场景图像中的文字检测方法 | |
Hensel et al. | Facade reconstruction for textured LoD2 CityGML models based on deep learning and mixed integer linear programming | |
CN113657274B (zh) | 表格生成方法、装置、电子设备及存储介质 | |
CN112989995B (zh) | 文本检测方法、装置及电子设备 | |
CN115423972A (zh) | 一种基于车载多激光雷达融合的封闭场景三维重建方法 | |
CN114677565B (zh) | 特征提取网络的训练方法和图像处理方法、装置 | |
WO2020125062A1 (zh) | 一种图像融合方法及相关装置 | |
CN109544516B (zh) | 图像检测方法及装置 | |
CN114429637B (zh) | 一种文档分类方法、装置、设备及存储介质 | |
CN115880536A (zh) | 数据处理方法、训练方法、目标对象检测方法及装置 | |
CN113591566A (zh) | 图像识别模型的训练方法、装置、电子设备和存储介质 | |
CN111353325A (zh) | 关键点检测模型训练方法及装置 | |
CN115019163A (zh) | 基于多源大数据的城市要素识别方法 | |
CN117115358B (zh) | 数字人自动建模方法及装置 | |
Huang et al. | Multi‐class obstacle detection and classification using stereovision and improved active contour models | |
CN113780040A (zh) | 唇部关键点的定位方法及装置、存储介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |