CN117541799A - 基于在线随机森林模型复用的大规模点云语义分割方法 - Google Patents

基于在线随机森林模型复用的大规模点云语义分割方法 Download PDF

Info

Publication number
CN117541799A
CN117541799A CN202410028448.8A CN202410028448A CN117541799A CN 117541799 A CN117541799 A CN 117541799A CN 202410028448 A CN202410028448 A CN 202410028448A CN 117541799 A CN117541799 A CN 117541799A
Authority
CN
China
Prior art keywords
point cloud
random forest
forest model
data
online random
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410028448.8A
Other languages
English (en)
Other versions
CN117541799B (zh
Inventor
张严辞
秦健翔
郝鹏举
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202410028448.8A priority Critical patent/CN117541799B/zh
Publication of CN117541799A publication Critical patent/CN117541799A/zh
Application granted granted Critical
Publication of CN117541799B publication Critical patent/CN117541799B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了基于在线随机森林模型复用的大规模点云语义分割方法,涉及点云数据处理领域,本申请包括:预处理点云数据;对点云分块数据的特征提取,并获取基于点云分块数据的成熟在线随机森林模型;对于待预测点云数据,在点云特征空间分布数据库中匹配其特征分布,使用匹配结果对应的成熟在线随机森林预测待预测点云数据。本申请的方法提高泛化能力、实时性且减少计算资源需求,本申请提供兼容性更好的框架设计,可以兼容和适应不同种类的点云数据处理方法,并且将单一机器的结果高效整合。

Description

基于在线随机森林模型复用的大规模点云语义分割方法
技术领域
本申请涉及点云数据处理领域,具体涉及基于在线随机森林模型复用的大规模点云语义分割方法。
背景技术
随着遥感技术的发展,获取高精度的大规模遥感城市点云变得更加容易。然而,对于覆盖数百米范围,包含数千万量级点的遥感城市场景点云,在工程背景下迅速获得准确的语义分割结果仍需要大量的人工标注工作。为了减少这种枯燥繁琐的工作,研究人员需要探索机器学习技术在处理点云语义分割方面的潜力。
经典的机器学习模型例如支持向量机SVM,随机森林RF,AdaBoost等,在点云场景上可以实现快速且良好的训练结果,但是需要人工设计特征保证模型的分类能力。
近年来,深度学习在点云语义分割领域取得了显著进展。例如PointNet、PointNet++、PointConv可以处理整个点云,但在大规模点云上的分割精度有限。RandLaNet可以快速、准确的大规模语义分割,但是容易受到数据采集噪声的影响。SQN以弱监督的方式降低标注成本,但是模型对训练数据的区域和规模敏感。尽管深度学习技术在复杂的特征提取方面展示了强大的能力,但仍需要大量的训练数据来避免训练中的过拟合问题。而且由于城市场景包含复杂的地区特征及地形信息,目前的方法不能很好的解决泛化性问题,导致这些方法的预训练模型在面对新点云数据时出现大量分割错误。所以,为了辅助点云语义分割,仍需要耗费大量时间标注新数据集来训练一个规模庞大的深度学习模型。
因此,亟需一种高效且具有强大泛化能力的大规模点云数据语义分割方法。这种方法应能够快速处理不同分布的数据集,实现高效准确的语义分割,而无需大量人工标注。这样的方法将显著提高点云语义分割的效率和可靠性,推动智慧城市建模和环境智能感知的发展。
发明内容
本申请基于在线随机森林模型复用的大规模点云语义分割方法,旨在解决现有技术中的问题。
第一方面,本申请提供基于在线随机森林模型复用的大规模点云语义分割方法,包括:分块训练多个成熟在线随机森林模型;
(1)使用预训练深度学习模型进行初始语义分割。虽然目前深度学习方法没有很好解决泛化性问题,但它可以快速提供完整的标注信息,减少人工成本,为在线随机森林模型奠定基础。(2)分块拟合多个在线随机森林模型。将结果规则分块,并挑选多块点云提取特征。针对几何、颜色、高程等方面设计的特征,可以增强模型的分割能力及特征统计精度。然后,使用在线随机森林模型拟合初始分割结果。通过分块训练,可以降低在线随机森林模型的训练时间,实现实时交互的要求。此外,由于大规模点云难以提取特征分布,分块方法可以更精确地提取局部特征值和特征分布特点。(3)人工校正训练成熟在线随机森林模型。通过人工校正快速优化模型中的错误参数,得到成熟在线随机森林模型与正确的语义分割结果。由于在线学习的特点,模型可以学习人工交互的逻辑来改进错误参数,并且修改其他相似的错误结果,这大大降低了人工交互的次数,加速模型的训练成熟过程。(4)初始化特征分布数据库与模型复用库。人工校正分割结果后,记录多维特征空间的直方图分布,将分布结果存储在特征分布数据库中,将对应的成熟在线随机森林模型存储在模型库中。建立一个规模可观的特征分布数据库和在线随机森林模型库,可以为后续预测点云块提供合适的模型,实现复用。这样可以避免重复训练和降低计算成本。
增量式复用成熟模型在分布一致的点云块上语义分割;
(1)复用成熟模型在分布一致的点云块上初始语义分割:首先,提取预测点云块的多维特征空间直方图分布,并使用模型复用策略计算相对特征分布数据库中每种分布的巴氏系数相似度。然后,挑选相似度最高分布的对应模型进行初始语义分割。由于机器学习模型遵从独立同分布假设,模型在分布接近训练集的预测集上表现更优。通过我们的复用策略确保训练集和预测集分布一致性,可以提高模型的准确预测能力。使得预测结果比泛化能力不足的预训练深度学习模型更好。这样可以减少需要人工校正的错误,加快模型的训练成熟过程。
(2)更新特征分布库与模型库:在成熟模型准确初始分割结果上,利用人工校正训练成熟新的在线随机森林模型,更新特征分布数据库和模型库。这样可以扩大模型复用策略的范围,提高预测效果,并实现边训练边预测的增量学习效果。随着数据库的规模增大,任意分布的点云块都可以找到最匹配的模型,从而实现我们提高泛用性的目标。此外,模型复用策略的初始分割结果会随着模型库的规模而不断提高,逼近最优秀的深度学习模型效果,而且需要的人工标注和训练等待时间更少。
进一步的,所述预处理点云数据,包括:对点云数据进行规则分块,获取到点云分块数据,并使用主流点云分割方法的预训练模型对点云分块数据进行初始分割,得到初始分割结果,用于为强监督在线随机森林的训练提供标注。
进一步的,所述对点云分块数据的特征提取,并获取基于点云分块数据的成熟在线随机森林模型,包括:
使用几何、高程、颜色三方面多个维度特征描述语义差异,提取所述点云分块数据的多维度特征并记录到点云特征空间分布数据库;
基于在线随机森林模型语义分割结果的人工校正数据作为训练集,迭代在线随机森林模型进行训练,获取满足点云分块数据预测准确率阈值的成熟在线随机森林模型,并记录到成熟在线随机森林模型库。
进一步的,所述对于待预测点云数据,在点云特征空间分布数据库中匹配其特征分布,使用匹配结果对应的成熟在线随机森林预测待预测点云数据,包括:
利用特征分布相似度评估算法匹配一个特征分布,该特征分布在点云特征空间分布数据库中与待预测点云数据的特征分布最为相似;
对应待预测的点云多维度特征空间分布与所述成熟在线随机森林模型;
判断对应的所述成熟在线随机森林模型获取的当前点云分块数据预测准确率是否满足阈值;
满足使用要求直接输出预测结果,不满足则在预测结果上训练新的在线随机森林模型,通过人工交互完成错误区域的修正并加快在线随机森林的训练成熟,获取满足阈值的语义分割结果和成熟在线随机森林模型。将预测点云块的分布与成熟模型添加进分布数据库和成熟模型库。
进一步的,所述利用点特征分布相似度评估算法匹配一个特征分布,该特征分布在点云特征空间分布数据库中与待预测点云数据的特征分布最为相似,包括基于点云多维特征空间分布计算,具体包括:
分析当前待预测的点云分块数据的语义在总的所述待处理点云分块数据的占比,并针对当前待预测的点云分块数据的不同语义进行特征提取,获取待预测的点云分块数据的多维度特征,分析当前待预测的点云分块数据的特征值分布情况。
进一步的,所述基于在线随机森林模型语义分割结果的人工校正数据作为训练集,迭代在线随机森林模型进行训练,获取满足点云分块数据预测准确率阈值的成熟在线随机森林模型,并记录到成熟在线随机森林模型库,包括:
对用于特征提取的点云语义分割模型的分割预测结果采用在线随机森林模型训练,获取训练中的随机森林模型语义分割结果,采用人工标记分割结果的错误区域,生成所述人工校正数据,将人工校正数据作为用于更新所述在线随机森林中不同决策树的分支节点的训练集输入,迭代训练输出满足点云分块数据预测准确率的成熟在线随机森林模型。
进一步的,所述多维特征空间分布相似度包括巴氏距离衡量直方图分布相似度。
进一步的,具体包括:使用预训练深度学习模型获取对应点云分块数据的用于特征提取的预测结果。
进一步的,具体包括:使用预训练点云语义分割模型获取对应点云分块数据的用于特征提取的预测结果。
第二方面,本发明还提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现以上任一项第一方面中所述的基于在线随机森林模型复用的大规模点云语义分割方法。
本申请的有益效果,包括:
本申请提高实时性和减少计算资源需求:通过使用在线学习思路和随机森林机器学习模型,可以通过分块并行处理来显著减少对单一计算机的计算资源的需求,并能够在实时的情况下提供反馈,允许多人合作完成;
本申请提高泛化能力:本申请提供的方法通过结合机器学习模型和人工交互,可以更好地处理不同采集方式,不同地面特征的点云数据,达到优秀的分割效果;
本申请提供兼容性更好的框架设计,可以兼容和适应不同种类的点云数据处理方法,并且将单一机器的结果高效整合;
本申请提供的模型复用框架可以学习到人工交互蕴含的逻辑,通过机器学习模型学习并模仿人工交互,在充分训练后能达到人工交互的效果,大大降低了人工校正的工作量,降低人工成本。
附图说明
此处所说明的附图用来提供对本申请实施例的进一步理解,构成本申请的一部分,并不构成对本申请实施例的限定。在附图中:
图1为本申请一示例性实施例中基于分块在线获得多个成熟模型及点云分布特点的训练阶段示意图。
图2为本申请一示例性实施例中基于复用成熟模型在分布一致点云块上语义分割的预测阶段示意图。
图3为本申请的基于在线随机森林模型复用的大规模点云语义分割方法的分段流程图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
基于在线随机森林模型复用的大规模点云语义分割方法需要大量标记完整的数据,尽管收集大规模点云数据不再是一个繁琐的过程,但在大规模数据集上手动生成点级标签需要高昂的成本。此外,目前的大规模点云分割方法仅针对特定场景进行训练,模型泛化性并不理想,分割准确率依赖训练数据集,而且预测结果并不能达到应用于城市建模的要求,还依赖人工校对。综上所述,针对点云分割的研究已经取得了不错的进展,但是依然存在一些亟待解决的问题:
(1)处理大规模数据的时间开销:智慧城市场景的点云模型规模庞大,达到数十亿级别的点云。处理这些大规模的数据需要大量的计算资源和时间,这在很大程度上限制了现有方法的应用。对于最先进的深度学习模型,在训练集规模的需求也比机器学习模型更大,耗费的时间成本进一步提升。
(2)处理大规模数据的预测准确率:目前最先进的深度学习方法即使通过很高成本的人工制作规模庞大的训练集,在其他区域得到一个很好的预测结果,仍然无法保证结果的完全正确,对于其余少部分的错误数据还需要由人工审核并予以处理,进一步加重了人工成本。
(3)泛化能力:虽然深度学习模型在特定的训练数据上可能表现良好,但是在新的、未见过的数据上可能表现不佳。这在智慧城市的环境中尤为重要,因为城市环境的复杂性和多样性,导致已经耗费大量人力训练好的模型在其他城市上的预测效果无法达到令人满意的结果,只能再次重新训练一个庞大的模型。另外,对于一个大型城市不同区划的地理特征同样存在显著区别,比如市中心的人流密集区与郊区的公园在道路宽阔程度、树木的密集程度、建筑的高度及密集程度都有很大区别,导致模型想要兼顾这两个场景就需要分别制作对应场景的训练集来保证预测效果,进一步加重模型训练需要的人工成本。
本申请的技术构思:
设计了一套高效多人合作校正、自适应学习人工校正逻辑并降低人工成本的大规模点云语义分割框架。本质上通过维护一个训练完毕的动态增长模型库和对应的一个记录点云块在多维度特征空间分布情况的动态增长分布数据库。且模型库与数据库内的记录是一一对应的关系。
本申请具体的应用场景是针对复杂城市地区及周边丘陵耕地地区提取场景。
本申请提供的基于在线随机森林模型复用的大规模点云语义分割方法,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
本申请提供基于在线随机森林模型复用的大规模点云语义分割方法,包括:
预处理点云数据;使用预训练深度学习模型在新数据集上进行初始语义分割,为后续在线随机森林提供标注信息。
对点云分块数据的特征提取,并获取基于点云分块数据的成熟在线随机森林模型;对新数据集分块并在每块上训练一个在线随机森林模型,拟合预训练深度学习模型的结果。设计新特征来描述不同语义类别的几何、颜色、高程特点,用于加强在线随机森林模型的学习能力。使用在线随机森林模型拟合对应点云块的初始语义分割结果,辅以多次人工交互完成纠错。由于在线学习的特点,每交互一次,在线学习的模型会学习到交互的特点,从而优化随机森林模型,并应用其他未交互的错误区域,降低总的交互次数,每人工矫正一个点云块,会得到完整的语义分割结果,和学习到当前点云块分布特点的成熟在线随机森林模型。
对于待预测点云数据,在点云特征空间分布数据库中匹配其特征分布,使用匹配结果对应的成熟在线随机森林预测待预测点云数据:随着人工校正过的点云块数量增加,设计直方图分布统计点云块在多维度特征空间的分布情况。使用的设计的新特征作为直方图的特征描述,可以体现不同分块的分布差异。提出分布相似度计算公式来建立已经人工校正点云块与预测点云块的分布关系,保证训练集与预测集一致的条件下复用成熟在线随机森林模型进行初始语义分割,这样能得到远高于预训练深度学习模型的语义分割准确率,由于模型的独立同分布假设,在相似度高的数据集上预测效果更好,通过复用成熟模型在相似度高的点云块上预测,可以比复用其他模型得到更好的语义分割结果;并且,继续在使用在线随机森林模型预测的结果上继续人工校正,并训练出新的在线随机森林模型,添加进复用模型中,扩大模型复用范围。
进一步的,所述预处理点云数据,包括:对点云数据进行规则分块,获取到点云分块数据,并使用主流点云分割方法的预训练模型对点云分块数据进行初始分割,得到初始分割结果,用于为强监督在线随机森林的训练提供标注。
进一步的,所述对点云分块数据的特征提取,并获取基于点云分块数据的成熟在线随机森林模型,包括:
提取所述点云分块数据的多维度特征并记录到点云特征空间分布数据库;
基于在线随机森林模型语义分割结果的人工校正数据作为训练集,迭代在线随机森林模型进行训练,获取满足点云分块数据预测准确率阈值的成熟在线随机森林模型,并记录到成熟在线随机森林模型库。
进一步的,所述对于待预测点云数据,在点云特征空间分布数据库中匹配其特征分布,使用匹配结果对应的成熟在线随机森林预测待预测点云数据,包括:
利用点特征分布相似度评估算法匹配一个特征分布,该特征分布在点云特征空间分布数据库中与待预测点云数据的特征分布最为相似;
对应待预测的点云多维度特征空间分布与所述成熟在线随机森林模型;
判断对应的所述成熟在线随机森林模型获取的当前点云分块数据预测准确率是否满足阈值;
输出满足使用要求的预测结果,或,将待预测的点云多维度特征空间分布对应的点云分块数据作为校验集输入,继续训练所述成熟在线随机森林模型,获取满足校验集输入预测准确率的拟合后成熟在线随机森林模型,绑定所述拟合后成熟在线随机森林模型与当前待预测的点云多维度特征空间分布信息加上原成熟在线随机森林模型的点云多维度特征分布信息。
进一步的,所述利用点特征分布相似度评估算法匹配一个特征分布,该特征分布在点云特征空间分布数据库中与待预测点云数据的特征分布最为相似,包括基于点云多维特征空间分布计算,具体包括:
分析当前待预测的点云分块数据的语义在总的所述待处理点云分块数据的占比,并针对当前待预测的点云分块数据的不同语义进行特征提取,获取待预测的点云分块数据的多维度特征,分析当前待预测的点云分块数据的特征值分布情况。
进一步的,所述基于在线随机森林模型语义分割结果的人工校正数据作为训练集,迭代在线随机森林模型进行训练,获取满足点云分块数据预测准确率阈值的成熟在线随机森林模型,并记录到成熟在线随机森林模型库,包括:
对用于特征提取的点云语义分割模型的分割预测结果采用在线随机森林模型训练,获取训练中的随机森林模型语义分割结果,采用人工标记分割结果的错误区域,生成所述人工校正数据,将人工校正数据作为用于更新所述在线随机森林中不同决策树的分支节点的训练集输入,迭代训练输出满足点云分块数据预测准确率的成熟在线随机森林模型。
进一步的,所述多维特征空间分布相似度包括直方图相似度、SSIM结构相似性系数。
进一步的,具体包括:使用弱监督的深度学习模型获取对应点云分块数据的用于特征提取的预测结果。
进一步的,具体包括:使用预训练点云语义分割模型获取对应点云分块数据的用于特征提取的预测结果。
图3为本申请的基于在线随机森林模型复用的大规模点云语义分割方法的分段流程图,如图3所示,根据模型库包含的模型数量,将整个框架分为两个阶段:训练阶段和成熟阶段,成熟阶段,即用于预测阶段。不同阶段使用到五个模块,模块相互之间流程上的先后关系,模块介绍如下:
模块一:输入是原始大规模遥感城市点云。输出是带有初始分割语义标签的规则点云块。具体流程是使用预训练深度学习模型在原始数据集上做初始语义分割。由于原始数据集的分布与预训练模型的分布存在显著差异,预训练模型的泛化能力不足以应对分布明显不同的数据集,所以初始语义分割结果有很大改善空间。然后,将初始分割结果规则切块输出给模块二。
模块二:输入是多个带有语义标签信息的点云块。输出是多个提取了多维度特征值和语义标签信息的点云块。具体流程是对每个点云块执行相同的特征提取算法。因为机器学***面度”、“散射”和“各向异性”。由于建筑和道路语义较为规则平整,树木和汽车语义分布不规则,协方差特征都能起到很好的区分作用。高程特征使用投影高程、投影高程差、投影高程方差、基于投影高程权重的平面度、投影密度。投影高程会先把点云投影在XOY平面上,将Z轴方向重叠的点聚类,每个聚类统一使用包含所有点中最大高程值作为投影高程特征结果。由于路面平整但高度低于建筑,所以投影高程可以显示表达地面与建筑,地面与树木,地面与汽车的差异。投影高程差则统计Z轴方向投影重叠点聚类内部最大高程与最小高程的差作为特征。投影高程方差则在投影高程差的基础上计算每个点相对邻域平均投影高程差的偏移距离。基于投影高程权重的平面度则使用投影高程差作为平面度的权重系数,区分不同高度的平面度特征。可以有效区分同样非常平坦的道路和建筑楼顶,因为建筑远高于道路,所以其权重系数更大,从而权重平面度更大。投影密度则计算Z轴方向投影重叠点聚类包含的点数,由于建筑普遍高于树木、汽车和道路,在Z轴方向投影后建筑的外立面的聚类内会重叠非常多的点,从而与其他语义区分开。颜色特征则使用RGB、RGB熵、LAB。RGB信息是数据集自带的,有助于区分树木与其他语义。RGB熵则会统计RGB变化剧烈的区域,可以加强不同语义边缘的提取。LAB颜色空间是一种描述颜色的方式,能精确地表示人类视觉***对颜色的感知,减轻RGB信息中的阴影问题造成的影响。模块二提取完多维度特征后会把特征结果和语义标签信息组合输出给模块三作为在线随机森林的拟合输入,并且把特征结果输出给模块五作为特征分布统计的输入。
模块三:输入是带有特征结果和语义标签的初始分割点云块。输出是满足要求的准确分割点云块和对应的成熟在线随机森林模型。具体流程是人工交互选择分割结果中不满意的区域,生成在线随机森林训练集。在线学习的特点就是会根据训练集重新更新模型的部分参数,向更接近最新训练集的方向优化模型。所以训练后的模型不仅会改正人工校正的错误区域,还会把其他近似错误区域一同修改,从而大幅降低人工交互次数。重复校正-训练-预测的流程,直到预测结果满足阈值后完成当前模块任务。图一中设置阈值为95%。将训练成熟的在线随机森林模型输出给模块四的模型库。
模块五:输入是带有特征结果的点云块。输出是点云块在多维特征空间的直方图分布情况。具体流程是一个特征对应一个直方图,每个直方图都划分多个区间,统计每个区间包含特征值的点数,将区间包含点数的分布情况作为当前特征维度的统计结果。此外,模块还能计算分布之间的相似度,具体流程是输入两个多维特征空间直方图分布,使用巴氏系数衡量每个维度的直方图分布相似度,计算所有维度的平均相似度。
模块四:输入是成熟在线随机森林模型和模型训练点云块的多维特征空间直方分布。具体流程是记录成熟在线随机森林模型和多维特征空间直方分布的对应关系,并根据不同分布的预测集复用分布最接近的成熟模型语义分割。因为机器学习模型是建立在训练集和预测集独立同分布的假设上,所以模型需要在分布一致的预测集上预测才能保证更优秀的预测效果。随着模型库数量增多,对于不同分布情况的预测集都能找到一致的模型复用,复用的分割准确率相对更好,可以解决传统模型在其他分布数据集上泛化表现不足的问题。
其中,图1为本申请一示例性实施例中基于分块在线获得多个成熟模型及点云分布特点的训练阶段示意图,如图1所示,训练阶段的目的是增加模型库内模型数量,并增加数据库的特征空间分布记录数量。步骤为:预处理点云数据,对点云分块数据的特征提取,并获取基于点云分块数据的成熟在线随机森林模型;详细为:提取所述点云分块数据的多维度特征并记录到点云特征空间分布数据库;
基于在线随机森林模型语义分割结果的人工校正数据作为训练集,迭代在线随机森林模型进行训练,获取满足点云分块数据预测准确率阈值的成熟在线随机森林模型,并记录到成熟在线随机森林模型库
具体为:借助模块一中的预训练深度学习模型在原始数据集上做初始分割并规则分块。然后,使用模块二提取多维度特征结果。并使用模块三中的人工交互更新在线随机森林模型,训练出预测准确率达到阈值以上的成熟在线随机森林模型与完整语义分割结果。图1中此处设置阈值为95%。模块五提取训练点云块在多维度特征空间的直方图分布情况。最后,将训练好的在线随机森林模型添加进模块四中的模型库中,将训练点云块的分布情况添加进模块四的分布数据库中。
其中,图2为本申请一示例性实施例中基于复用成熟模型在分布一致点云块上语义分割的预测阶段示意图,如图2所示,成熟阶段的目的是使用模型库内的成熟随机森林模型辅助分割后续的预测点云块,尽可能选择最恰当的模型,提高预测准确率,从而减轻人工校正的次数。步骤为:对于待预测点云数据,在多维特征空间分布数据库中匹配最接近其特征分布的训练点云块,复用匹配结果对应的成熟在线随机森林预测待预测点云数据,在预测结果上训练新成熟模型和统计特征分布来更新模型库和分布库。详细为:利用点特征分布相似度评估算法匹配一个特征分布,该特征分布在点云特征空间分布数据库中与待预测点云数据的特征分布最为相似;复用分布最接近的点云块所训练的成熟随机森林模型做语义分割;在分割结果基础上训练新在线随机森林模型并统计预测点云块特征分布;判断准确率是否满足阈值;不满足继续人工校正错误区域并优化;输出满足使用要求的预测结果。具体为:图2为本申请一示例性实施例中基于复用成熟模型在分布一致点云块上语义分割的预测阶段示意图。如图2所示,预测阶段示意图中显示,对待预测点云切块并提取多维特征分布,使用随机森林模型复用算法选择最恰当的成熟随机森林模型预测点云块,保证模型在分布一致的预测集上语义分割。此外,复用成熟随机森林模型的效果会好于预训练深度学习模型的效果,所以需要人工校正的区域显著减少,或者,直接输出满足预测准确率阈值的结果,即,满足用户使用要求。随着不断有随机森林模型添加进数据库,可供选择的模型数量增多,预测准确率更高的模型随之增加,只要模型数量达到一定规模,最终能保证挑选出的随机森林模型预测准确率直接达到阈值以上,图2中,阈值取95%,避免后续人工校正的工作量。而对于预测准确率不满意的情况,同样可以通过在线随机森林训练的流程进行校正,校正过程为:将复用模型的语义分割结果作为输入,训练新的在线随机森林模型,并通过人工交互训练成熟,获取满足校验集输入预测准确率的拟合后成熟在线随机森林模型,绑定所述成熟在线随机森林模型与当前待预测的点云多维度特征空间分布信息,把模型加入模型库中,扩大模型复用范围。通过维护一个点云语义分割模型库,可以包含支持实时交互的在线学习模型,即,在线随机森林模型以及训练成本巨大但效果优秀的深度学习模型。
实际操作中,本实施例中采用如下方式,在解决兼容性问题上,模型库支持不同种类语义分割模型,可以根据不同问题需要选择对应的方法,比如针对时效性要求高的可以选择在线随机森林模型,针对预测准确率高的可以选OMCBoost模型,针对场景细节复杂繁多的数据集可以选择PointNet模型,针对场景特征较为一致但是规模及其庞大的数据集可以选择RandLa-Net,针对标注工作量大的数据集可以选择弱监督模型等。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现,如模块一到五。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。
本领域内的技术人员应明白,本发明的实施例可提供为方法或装置。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由上面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims (9)

1.基于在线随机森林模型复用的大规模点云语义分割方法,其特征在于,包括:
预处理点云数据:
使用预训练深度学习模型在新数据集上进行初始语义分割;
对点云分块数据的特征提取,并获取基于点云分块数据的成熟在线随机森林模型:
对新数据集分块并在每块上训练一个在线随机森林模型,拟合预训练深度学习模型的结果,设计新特征来描述不同语义类别的特点,使用在线随机森林模型拟合对应点云块的初始语义分割结果,辅以多次人工交互完成纠错,每交互一次,在线学习的模型学到交互的特点,优化随机森林模型,并应用其他未交互的错误区域,每人工矫正一个点云块,得到完整的语义分割结果,学习到当前点云块分布特点的成熟在线随机森林模型;
对于待预测点云数据,在点云特征空间分布数据库中匹配其特征分布,使用匹配结果对应的成熟在线随机森林预测待预测点云数据:
随着人工校正过的点云块数量增加,设计直方图分布统计点云块在多维度特征空间的分布情况,使用设计的新特征作为直方图的特征描述,采用分布相似度计算公式来建立已经人工校正点云块与预测点云块的分布关系,通过训练集与预测集在一致的条件下复用成熟在线随机森林模型进行初始语义分割,继续在使用在线随机森林模型预测的结果上继续人工校正,并训练出新的在线随机森林模型,添加进复用模型中,扩大模型复用范围。
2.根据权利要求1所述的基于在线随机森林模型复用的大规模点云语义分割方法,其特征在于,所述预处理点云数据,包括:
对点云数据进行规则分块,获取到点云分块数据,并使用主流点云分割方法的预训练模型对点云分块数据进行初始分割,得到初始分割结果,用于为强监督在线随机森林的训练提供标注。
3.根据权利要求2所述的基于在线随机森林模型复用的大规模点云语义分割方法,其特征在于,所述对点云分块数据的特征提取,并获取基于点云分块数据的成熟在线随机森林模型,包括:
其中,设计的特征新的描述不同语义差异,包括用于增强在线随机森林模型预测能力的不同语义类别的几何、颜色、高程特点;
提取所述点云分块数据的多维度特征并记录到点云特征空间分布数据库;
基于在线随机森林模型语义分割结果的人工校正数据作为训练集,迭代在线随机森林模型进行训练,获取满足点云分块数据预测准确率阈值的成熟在线随机森林模型,并记录到成熟在线随机森林模型库。
4.根据权利要求3所述的基于在线随机森林模型复用的大规模点云语义分割方法,其特征在于,所述对于待预测点云数据,在点云特征空间分布数据库中匹配其特征分布,使用匹配结果对应的成熟在线随机森林预测待预测点云数据,包括:
利用点特征分布相似度评估算法匹配一个特征分布,该特征分布在点云特征空间分布数据库中与待预测点云数据的特征分布最为相似;
对应待预测的点云多维度特征空间分布与所述成熟在线随机森林模型;
判断对应的所述成熟在线随机森林模型获取的当前点云分块数据预测准确率是否满足阈值;
输出满足使用要求的预测结果,或,将待预测的点云多维度特征空间分布对应的点云分块数据作为校验集输入,继续训练所述成熟在线随机森林模型,获取满足校验集输入预测准确率的拟合后成熟在线随机森林模型,绑定所述拟合后成熟在线随机森林模型与当前待预测的点云多维度特征空间分布信息加上原成熟在线随机森林模型的点云多维度特征分布信息。
5.根据权利要求4所述的基于在线随机森林模型复用的大规模点云语义分割方法,其特征在于,所述利用点特征分布相似度评估算法匹配一个特征分布,该特征分布在点云特征空间分布数据库中与待预测点云数据的特征分布最为相似,包括基于点云多维特征空间分布计算,具体包括:
分析当前待预测的点云分块数据的语义在总的待处理点云分块数据的占比,并针对当前待预测的点云分块数据的不同语义进行特征提取,获取待预测的点云分块数据的多维度特征,分析当前待预测的点云分块数据的特征值分布情况。
6.根据权利要求3所述的基于在线随机森林模型复用的大规模点云语义分割方法,其特征在于,所述基于在线随机森林模型语义分割结果的人工校正数据作为训练集,迭代在线随机森林模型进行训练,获取满足点云分块数据预测准确率阈值的成熟在线随机森林模型,并记录到成熟在线随机森林模型库,包括:
对用于特征提取的点云语义分割模型的分割预测结果采用在线随机森林模型训练,获取训练中的随机森林模型语义分割结果,采用人工标记分割结果的错误区域,生成所述人工校正数据,将人工校正数据作为用于更新所述在线随机森林中不同决策树的分支节点的训练集输入,迭代训练输出满足点云分块数据预测准确率的成熟在线随机森林模型。
7.根据权利要求1所述的基于在线随机森林模型复用的大规模点云语义分割方法,其特征在于,所述多维特征空间分布相似度包括直方图相似度、SSIM结构相似性系数。
8.根据权利要求2所述的基于在线随机森林模型复用的大规模点云语义分割方法,其特征在于,具体包括:使用弱监督的深度学习模型获取对应点云分块数据的用于特征提取的预测结果。
9.根据权利要求2所述的基于在线随机森林模型复用的大规模点云语义分割方法,其特征在于,具体包括:使用预训练点云语义分割模型获取对应点云分块数据的用于特征提取的预测结果。
CN202410028448.8A 2024-01-09 2024-01-09 基于在线随机森林模型复用的大规模点云语义分割方法 Active CN117541799B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410028448.8A CN117541799B (zh) 2024-01-09 2024-01-09 基于在线随机森林模型复用的大规模点云语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410028448.8A CN117541799B (zh) 2024-01-09 2024-01-09 基于在线随机森林模型复用的大规模点云语义分割方法

Publications (2)

Publication Number Publication Date
CN117541799A true CN117541799A (zh) 2024-02-09
CN117541799B CN117541799B (zh) 2024-03-08

Family

ID=89794178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410028448.8A Active CN117541799B (zh) 2024-01-09 2024-01-09 基于在线随机森林模型复用的大规模点云语义分割方法

Country Status (1)

Country Link
CN (1) CN117541799B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722725A (zh) * 2012-06-04 2012-10-10 西南交通大学 一种基于主动场景学习的对象跟踪方法
CN105719279A (zh) * 2016-01-15 2016-06-29 上海交通大学 基于椭圆柱的人体躯干建模及手臂区域分割和手臂骨架提取方法
CN108681525A (zh) * 2018-05-16 2018-10-19 福州大学 一种基于车载激光扫描数据的路面点云强度增强方法
CN113989535A (zh) * 2021-10-25 2022-01-28 辽宁工程技术大学 一种结合区域生长和随机森林的点云分类方法
WO2022088676A1 (zh) * 2020-10-29 2022-05-05 平安科技(深圳)有限公司 三维点云语义分割方法、装置、设备及介质
US20220148184A1 (en) * 2020-11-10 2022-05-12 Here Global B.V. Method, apparatus, and system using a machine learning model to segment planar regions
CN114842262A (zh) * 2022-05-10 2022-08-02 中国南方电网有限责任公司超高压输电公司检修试验中心 融合线路通道正射影像的激光点云地物自动识别方法
CN115482380A (zh) * 2022-09-15 2022-12-16 电子科技大学 一种基于深度学习的多等级公路三维点云目标分割方法
CN115761172A (zh) * 2022-10-10 2023-03-07 哈尔滨工程大学 一种基于点云语义分割与结构拟合的单体建筑三维重建方法
CN115861619A (zh) * 2022-12-20 2023-03-28 重庆大学 一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与***

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722725A (zh) * 2012-06-04 2012-10-10 西南交通大学 一种基于主动场景学习的对象跟踪方法
CN105719279A (zh) * 2016-01-15 2016-06-29 上海交通大学 基于椭圆柱的人体躯干建模及手臂区域分割和手臂骨架提取方法
CN108681525A (zh) * 2018-05-16 2018-10-19 福州大学 一种基于车载激光扫描数据的路面点云强度增强方法
WO2022088676A1 (zh) * 2020-10-29 2022-05-05 平安科技(深圳)有限公司 三维点云语义分割方法、装置、设备及介质
US20220148184A1 (en) * 2020-11-10 2022-05-12 Here Global B.V. Method, apparatus, and system using a machine learning model to segment planar regions
CN113989535A (zh) * 2021-10-25 2022-01-28 辽宁工程技术大学 一种结合区域生长和随机森林的点云分类方法
CN114842262A (zh) * 2022-05-10 2022-08-02 中国南方电网有限责任公司超高压输电公司检修试验中心 融合线路通道正射影像的激光点云地物自动识别方法
CN115482380A (zh) * 2022-09-15 2022-12-16 电子科技大学 一种基于深度学习的多等级公路三维点云目标分割方法
CN115761172A (zh) * 2022-10-10 2023-03-07 哈尔滨工程大学 一种基于点云语义分割与结构拟合的单体建筑三维重建方法
CN115861619A (zh) * 2022-12-20 2023-03-28 重庆大学 一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与***

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MARTIN WEINMANN 等: "Semantic point cloud interpretation based on optimal neighborhoods, relevant features and efficient classifiers", 《ELSEVIER》, vol. 105, 27 February 2015 (2015-02-27), pages 286 - 304, XP029575087, DOI: 10.1016/j.isprsjprs.2015.01.016 *
杨超: "一种用于遥感影像地表覆盖的语义分割算法", 《中国优秀硕士学位论文全文数据库基础科学辑》, no. 03, 15 March 2023 (2023-03-15), pages 008 - 144 *
陈睿星 等: "顾及长尾分布的机载LiDAR点云CNN语义分割", 《仪器仪表学报》, vol. 44, no. 7, 31 July 2023 (2023-07-31), pages 282 - 295 *
韩姗姗: "基于深度学习的倾斜摄影测量点云建筑物语义与实例联合分割", 《中国优秀硕士学位论文全文数据库基础科学辑》, no. 001, 15 January 2021 (2021-01-15), pages 008 - 290 *

Also Published As

Publication number Publication date
CN117541799B (zh) 2024-03-08

Similar Documents

Publication Publication Date Title
US8238660B2 (en) Hybrid graph model for unsupervised object segmentation
CN111444821A (zh) 一种城市道路标志自动识别方法
CN114092832B (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
CN102592268B (zh) 一种分割前景图像的方法
CN110188228B (zh) 基于草图检索三维模型的跨模态检索方法
CN106503035A (zh) 一种知识图谱的数据处理方法和装置
CN113379898B (zh) 一种基于语义分割的三维室内场景重建方法
CN110675421B (zh) 基于少量标注框的深度图像协同分割方法
CN105046714A (zh) 一种非监督的基于超像素和目标发现机制的图像分割方法
CN115049841A (zh) 基于深度无监督多步对抗域自适应的高分辨sar图像地物要素提取方法
CN114283285A (zh) 交叉一致性自训练遥感图像语义分割网络训练方法及装置
CN113989747A (zh) 终端区气象场景识别***
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及***
CN113034511A (zh) 基于高分辨率遥感影像与深度学习的乡村建筑识别算法
CN103456029A (zh) 一种抗相似颜色和光照变化干扰的Mean Shift跟踪方法
CN117274750B (zh) 一种知识蒸馏半自动可视化标注方法及***
CN102609721B (zh) 遥感影像的聚类方法
CN117541799B (zh) 基于在线随机森林模型复用的大规模点云语义分割方法
CN112116612A (zh) 基于Mask R-CNN的行道树图像实例分割方法
CN103336781B (zh) 一种医学图像聚类方法
CN113008226B (zh) 基于门控循环神经网络和粒子滤波的地磁室内定位方法
Geng et al. A novel color image segmentation algorithm based on JSEG and Normalized Cuts
CN114022520A (zh) 一种基于卡尔曼滤波与孪生网络的机器人目标跟踪方法
CN113989676A (zh) 改进深度卷积自编码嵌入聚类的终端区气象场景识别方法
CN113705326A (zh) 一种基于全卷积神经网络的城市建设用地识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant